Публикации по тегам data-preprocessing

Публикации по теме 'data-preprocessing'

Предварительная обработка данных: важная роль в машинном обучении

Подготовка данных является жизненно важным, но иногда пропускаемым этапом конвейера машинного обучения. Это то, что я понял во время обучения. Хотя создание сложных моделей глубокого обучения — это весело, использование неверных данных все равно приведет к плохим результатам. мусор на входе, мусор на выходе, как говорится. Разве это не правда? В этой статье мы обсудим важность подготовки данных и познакомимся с несколькими типичными методами преобразования необработанных данных в..

Предварительная обработка данных — Обработка пропущенных значений

Методы обработки пропущенных значений в наборах данных В этом блоге я хотел бы рассказать о методах, с помощью которых можно справиться с недостающими ячейками или значениями в наборе данных. Вы, должно быть, видели ошибку при работе с любым набором данных, в котором эти данные отсутствуют, или стоит ли использовать это отсутствующее значение или нет. Существует множество методов, с помощью которых можно работать с этими значениями в наборе данных. Это этап очистки данных при..

Справедливость в машинном обучении: алгоритмы предварительной обработки

Соавторы: Кэролин Саплицки , специалист по обработке и анализу данных в Expert Labs, и Митали Банте , специалист по анализу данных в Expert Labs. В нашем предыдущем блоге Объяснение честности: определения и показатели мы обсуждаем определения и показатели справедливости на реальном примере. Это закладывает основу для того, как можно определить предвзятость в машинном обучении. В частности, мы используем такие инструменты, как Компас справедливости и Справедливость AI 360 , чтобы..

ML707 — ПОДГОТОВКА ДАННЫХ

ML707 — ПОДГОТОВКА ДАННЫХ Подготовка данных, также известная как предварительная обработка данных, является важным этапом рабочего процесса машинного обучения, который включает очистку, преобразование и подготовку данных для использования алгоритмами машинного обучения. Вот некоторые распространенные методы, используемые при подготовке данных: Очистка данных. Очистка данных включает выявление и обработку отсутствующих, противоречивых или ошибочных данных в наборе данных...

Лучшие советы по подготовке данных с использованием Python

Привет, друзья! Добро пожаловать в руководство по подготовке данных с использованием Python . поэтому в этом посте мы изучим важную тему науки о данных, а именно предварительную обработку данных . Предварительная обработка относится к преобразованию, применяемому к нашим данным перед их передачей в алгоритм. Предварительная обработка данных — это метод, который используется для преобразования необработанных данных в чистый набор данных. другими словами, всякий раз, когда данные..

Эффективное использование t-SNE

Хотя анализировать многомерные данные очень сложно. t-SNE ( t-распределенное стохастическое соседнее встраивание ) дает нам способ уменьшить нашу размерность с n-D до 2-D для визуализации. t-SNE был разработан Лоренс ван дер Маатенс и Джеффри Хинтон в 2008 году . Как работает t-SNE? Предположим, у нас есть точка X i в любом n-D пространстве. t-SNE пытается сохранить соседей Xi от пространства n-D до пространства n-D ’( D’ - меньшее измерение после уменьшения размерности )...

Очистка данных с помощью инструмента Rapid Miner Turbo Prep

Автор: Марсель Брито. Набор данных: болезни сердца из репозитория машинного обучения UCI Этот набор данных содержит наблюдения за 303 пациентами по 14 признакам, протестированным на наличие сердечных заболеваний у пациента из базы данных Кливленда. Процесс очистки данных очень важен в анализе данных и машинном обучении, потому что это шаг, который организует данные и предоставляет статистические методы для подбора лучшей модели, которая может привести к лучшей оценке. Поскольку данные..