Публикации по теме 'data-pre-processing'


Обработка несбалансированных данных: перспектива науки о данных
Как специалисты по данным, одна из наиболее распространенных проблем, с которыми мы сталкиваемся, — это несбалансированные данные. Несбалансированные данные относятся к набору данных, в котором один класс или метка значительно недопредставлены по сравнению с другими классами. Это может произойти в различных реальных сценариях, таких как обнаружение мошенничества, медицинская диагностика и прогнозирование оттока клиентов. В этом сообщении блога я расскажу о важности для бизнеса обработки..

Обработка данных для машинного обучения и науки о данных, лучшие методы обработки категориальных данных.
В этой статье мы обсудим лучшие методы и алгоритмы обработки и преобразования данных для достижения максимальной точности моделей машинного обучения. Эта статья о некоторых методах, которые помогают нам в обработке и обработке данных. Процесс обработки данных помогает нам преобразовывать категориальные данные в числовые данные, потому что алгоритмы понимают только числовые значения, и это будет предметом обсуждения в этой статье в дополнение ко многим другим методам обработки данных...

Knime — предварительная обработка данных, очистка данных для моделирования.
Knime — предварительная обработка данных, очистка данных для моделирования. Неважно, насколько хорошо вы умеете строить небоскреб, если фундамент неправильный, он однажды рухнет. Так обстоит дело с моделированием в науке о данных. Неважно, какую технику моделирования вы используете, если вы неправильно понимаете данные и не прилагаете усилий к очистке данных, вы никогда не сможете создать хорошую модель из необработанных данных. По этой причине почти 60–70% времени уходит на..

Что такое Feature Engineering?
Непрерывные основные концепции проектирования функций и прикладные примеры в Python: выбросы, отсутствующие значения, кодировщики, масштабирование функций, извлечение функций Если вы имеете отношение к темам машинного обучения или искусственного интеллекта, вы наверняка слышали о «разработке функций». Я хочу процитировать Томаса С. Редмана, прежде чем я начну писать. Если ваши данные плохие, ваши инструменты машинного обучения бесполезны. - Красный человек Итак, основное правило в..

Что такое предварительная обработка данных
Когда мы говорим о данных, мы обычно думаем о больших наборах данных с огромным количеством строк и столбцов. Хотя это вероятный сценарий, это не всегда так — данные могут быть в самых разных формах: структурированные таблицы, изображения, аудиофайлы, видео и т. д. Машины не понимают свободный текст, изображения или видеоданные как таковые, они понимают единицы и нули. Так что, вероятно, будет недостаточно, если мы покажем слайд-шоу всех наших изображений и будем ожидать, что наша модель..

Предварительная обработка спутниковых изображений для проекта машинного обучения
Я работал инженером-программистом. Причина, по которой я хотел бы написать этот пост, - поделиться своим недавним опытом работы со спутниковыми изображениями и тем, как использовать спутниковые изображения в проекте машинного обучения. Раздел 1. Зачем нужны спутниковые снимки Спутниковые изображения содержат информацию, полезную для проектов, связанных с данными. Там нас ждет множество спутниковых снимков. И что еще важнее, они бесплатны (не все, есть коммерческие спутниковые..

Простые способы извлечения функций из переменной даты с помощью Python
Переменные даты - это особый тип категориальной переменной. Хотя на первый взгляд дата дает нам не что иное, как конкретную точку на временной шкале, при правильной предварительной обработке они могут значительно обогатить набор данных. Общие форматы даты содержат числа, а иногда и текст, чтобы указать месяцы и дни. Приведение дат в удобный формат и извлечение функций дат в новые переменные могут быть полезными этапами предварительной обработки. Например, из переменной даты вы можете..