Публикации по теме 'data-preprocessing'


Выбор функций в машинном обучении: мотивация
Выбор функций в машинном обучении: мотивация Эта короткая статья является первой из серии, в которой объясняются методы выбора признаков. Я начал с дружеского вступления и представил веские причины, лежащие в основе процесса выбора функций. В следующих статьях я подробно расскажу о каждом методе выбора признаков. Выбор признаков — это процесс выбора подмножества соответствующих признаков (переменных, предикторов) из общего числа признаков уровня в наборе данных для построения..

Контрольный список подготовки данных для машинного обучения
20 задач, которые должен выполнить каждый специалист по данным ДО моделирования Вы только что узнали, как сделать lr = LinearRegression() в Python. Поздравляю! Вы рады начать создавать модели машинного обучения… Но вы сталкиваетесь с некоторыми проблемами. Ваши данные грязные. Вы понимаете, что не можете вводить текст или поля даты в модель. У этого списка нет конца. Реальность такова, что специалисты по данным выполняют массу подготовительной работы ДО моделирования — до..

Предварительная обработка в машинном обучении
Если нам нужно, чтобы какую-то работу выполняли другие, то их следует обучить такой работе. Подобным образом машина также обучается работе и определяет ее совершенство с точки зрения метрик. В основном используемые метрики — это точность, точность. Как мы обсуждали в наших предыдущих статьях, человек учится быстро, но требует времени, чтобы выполнить огромный объем работы. С другой стороны, машина учится медленно, но делает это быстро. Что касается предварительной обработки, она помогает..

Данные для прогнозирования того, какие сотрудники могут уйти
Данные для прогнозирования того, какие сотрудники могут уйти Нет одинаковых специалистов по данным — часть 2 Эта статья является частью нашей серии статей о том, как разные специалисты по обработке и анализу данных по-разному строят схожие модели. Нет одинаковых людей, и, следовательно, нет одинаковых специалистов по данным. И обстоятельства, при которых необходимо решать проблемы с данными, постоянно меняются. По этим причинам для выполнения поставленной задачи могут и будут..

Жизненный цикл задачи машинного обучения — пишет начинающий
Я новичок в ML (Ну, это правда). Я пишу все, как я учусь. Если я смогу объяснить, это будет здорово! Я много узнал о жизненном цикле машинного обучения, и внезапно мне в голову пришла случайная мысль: «Эй, а как насчет того, чтобы написать то, что я считаю жизненным циклом машинного обучения, и позволить другим людям прочитать и отреагировать?». Итак, поехали! Множество программистов и инженеров по всему миру каждый день пишут код для разработки программного обеспечения. Они,..

Предварительная обработка данных и построение моделей
Практическое руководство по подготовке данных для алгоритмов машинного обучения В частях 1 и 2 этой серии мы обсудили анализ данных и разработку новых функций, которые улучшат наши прогностические модели. В этом посте будет представлена ​​концепция предварительной обработки данных. Что такое предварительная обработка данных Предварительная обработка данных — это манипулирование данными, включая удаление нерелевантных и/или неполных функций, и/или анализ данных для..

Важность функций и выбор функций
Важность функции: Это относится к методам, которые присваивают оценку входным функциям в зависимости от того, насколько они полезны для прогнозирования целевых переменных. Выбор функции: Это процесс, в котором вы автоматически или вручную выбираете функции, которые больше всего влияют на вашу целевую переменную. Короче говоря, оценка важности функции используется для выполнения выбора функции. В данном примере набора данных Iris у нас есть четыре функции и одна целевая..