Публикации по теме 'exploratory-data-analysis'


Прогнозирование сердечных заболеваний с помощью машинного обучения
Проблемы классификации - одна из наиболее распространенных областей, где алгоритмы машинного обучения применяются с отличными результатами. Самая большая разница между проблемой регрессии и проблемой классификации состоит в том, что в задаче классификации целевая переменная является категориальной / двоичной. В этой статье мы рассмотрим набор данных о сердечном ритме, опубликованный репозиторием машинного обучения UCI, где целевой переменной является болезнь сердца. Мы рассмотрим несколько..

Бизнес-анализ оттока клиентов банка
Бизнес-анализ оттока клиентов банка Эта запись в блоге посвящена бизнес-вопросам по набору данных об оттоке клиентов банка. Мы можем определить отток клиентов как финансовый термин, который относится к потере клиента, то есть когда клиент перестает взаимодействовать с бизнесом. Для анализа бизнес-вопросов я использовал набор данных об оттоке клиентов банка. В наборе данных есть несколько переменных, которые можно четко разделить на 3 категории: Демографические данные о клиентах..

Исследовательский анализ данных — Набор данных выживания Хабермана
Исследовательский анализ данных — самый важный шаг в машинном обучении (это важный шаг, а также фундаментальная и отправная точка в машинном обучении). Без EDA решение проблемы машинного обучения бесполезно. В этом блоге мы сначала рассмотрим, почему EDA?, Ценность EDA, Методы EDA, Почему пропускать EDA — плохая идея, а затем возьмем пример и посмотрим, что мы можем сделать из EDA. Исследовательский анализ данных (EDA) помогает ответить на все эти вопросы, обеспечивая наилучшие..

Применение алгоритма Рамера-Дугласа-Пекера в машинном обучении, о котором вы, возможно, не слышали…
Введение Алгоритм Рамера-Дугласа-Пекера, также известный как алгоритм Дугласа-Пекера и алгоритм итеративного подбора конечных точек , представляет собой алгоритм картографического/линейного обобщения. Это в основном уменьшает количество точек в кривой/линии без потери формы кривой/линии, основываясь на некотором параметре допуска «эпсилон» (ε). Это имеет широкий спектр приложений, от робототехники до векторной графики. Это тот же алгоритм, который использовался для упрощения путевых..

Исследовательский анализ данных
Исследовательский анализ данных - это исследование данных с помощью инструментов построения графиков, линейной алгебры, статистики и некоторых замечательных библиотек, чтобы понять, что на самом деле представляют собой данные, прежде чем переходить к моделированию. Я использую данные об индийском сельском хозяйстве. Сельское хозяйство Индии состоит из многих культур, большая часть из которых составляет рис и пшеница. Индийские фермеры выращивают бобовые, картофель, сахарный тростник,..

Что нужно знать, прежде чем создавать свою первую модель ML
Сага о деталях, важных, но о которых обычно забывают. Если вы прошли свой первый MOOC по машинному обучению (он же Эндрю Нг на Coursera ) и хотите изучить дальнейшие возможности в этой области, или вы тот, кто следил за новостями о Data Science и машинном обучении и хотите проверить, field - это то, что вам нужно, вы находитесь в нужном месте (виртуально), чтобы узнать о некоторых ингредиентах рецепта, которые помогут вам ярко сиять с помощью ML. Разделив ML на компоненты, три из них, о..

Масштабирование функций: - Нормализация, стандартизация и масштабирование!
Когда ваши данные состоят из атрибутов с разным масштабом, многие алгоритмы машинного обучения могут выиграть от изменения масштаба атрибутов, чтобы все они имели одинаковый масштаб. Часто это называется нормализацией, и атрибуты часто масштабируются в диапазоне от 0 до 1. Это метод стандартизации независимых переменных, представленных в фиксированном диапазоне, чтобы привести все значения к одинаковым величинам. Обычно выполняется на этапе предварительной обработки данных, а также..