Публикации по теме 'data-preprocess'


Учебник по машинному обучению №1: Предварительная обработка
Темы: Очистка данных, Выбор целевой переменной, Извлечение признаков, Масштабирование, Уменьшение размерности В этом руководстве по машинному обучению я исследую 4 этапа, которые определяют типичный проект машинного обучения: предварительная обработка, обучение, оценка и прогнозирование (развертывание). В этой первой части я завершу этап предварительной обработки. Другие уроки в этой серии: Предварительная обработка №1 (эта статья), Обучение №2 , Оценка №3 , Прогнозирование №4 Я..

Объяснение бинирования данных
Объяснение бинирования данных Предыстория и отказ от ответственности. В компании, в которой я работаю, мы разделили наших клиентов на четыре класса в зависимости от их платежного поведения. Как правило, при сегментировании клиентов в бизнес-среде используются три параметра: давность (как недавно клиент совершил покупку), частота (как часто клиент совершает покупки) и денежный (сколько клиент тратит на каждую покупку). Однако в этом случае я буду использовать частоту только для..

Основы машинного обучения: выбор функций (часть 2)
Добро пожаловать назад. Предыстория того, что именно мы здесь делаем, находится здесь . Теперь двинемся вперед. Обратное устранение Мы будем отбирать компоненты на основе метода обратного исключения . Что такое обратное исключение ? Это метод сохранения только тех функций, которые важны для набора данных, т. Е. С учетом того, что эти функции вносят существенные изменения в зависимую переменную . Вот как работает этот алгоритм: Выберите уровень значимости . Совместите..