Публикации по теме 'data-preprocessing'


Предварительная обработка набора данных перед использованием модели классификации KNN
Я расскажу об идее KNN, а затем перейду к нашей основной теме «удаление потенциально опасных примеров из обучающей выборки». В этой статье предполагается, что читатель имеет базовое представление о таких терминах, как классификаторы, примеры обучения и тестирования, вектор признаков, евклидово расстояние . Основная идея классификатора KNN: Два очень похожих друг на друга растения, вероятно, представляют один и тот же вид; аналогично, довольно часто пациенты, жалующиеся на..

Сравнительный анализ алгоритмов машинного обучения
Машинное обучение - это приложение искусственного интеллекта (ИИ), которое дает системам возможность автоматически учиться и совершенствоваться на основе опыта без явного программирования. Алгоритмы машинного обучения часто делятся на контролируемые и неконтролируемые. Что такое машинное обучение с учителем? При обучении с учителем вы обучаете машину, используя данные, которые хорошо помечены . Это означает, что некоторые данные уже помечены правильным ответом. Это можно..

Масштабирование функций и его важность в предварительной обработке данных. Нормализация и стандартизация.
Масштабирование функций Масштабирование признаков относится к методам или методам, используемым для нормализации диапазона независимых переменных в наших данных, или, другими словами, к методам установки диапазона значений признаков в пределах аналогичного масштаба. Масштабирование признаков обычно является последним шагом в конвейере предварительной обработки данных, выполняемым непосредственно перед обучением алгоритмов машинного обучения . Величина функции имеет значение, потому..

Предварительная обработка данных
Реализация В основе машинного обучения лежит обработка данных. Ваши инструменты машинного обучения настолько же хороши, насколько и качество ваших данных . В этом блоге рассматриваются различные этапы очистки данных . Ваши данные должны пройти несколько этапов, прежде чем их можно будет использовать для прогнозирования. Набор данных для этого блога можно получить здесь . Этапы предварительной обработки данных: Импорт необходимых библиотек Импорт набора данных..

Конвейер для предварительной обработки текстовых данных
Используйте Python для упрощения всей подготовительной работы к моделированию с использованием текстовых данных Гитхаб ссылка Введение Перейдите непосредственно к разделу «Конвейер», если он вас больше интересует, чем узнать о быстрой мотивации, стоящей за ним: Конвейер предварительной обработки текста (половина блога). Я рассматривал возможность машинного обучения текстовых данных, но есть некоторые этапы предварительной обработки данных, уникальные для текстовых данных, к..

Предварительная обработка данных для машинного обучения
Предварительная обработка данных — это метод, который используется для преобразования необработанных данных в чистый набор данных. Другими словами, всякий раз, когда данные собираются из разных источников, они собираются в необработанном формате, что невозможно для анализа. Необходимость предварительной обработки данных: Для достижения лучших результатов от прикладной модели в проектах машинного обучения формат данных должен быть правильным. Некоторой указанной модели машинного..

Шесть шагов для оттачивания ваших данных: предварительная обработка данных, часть 4
Это руководство отвечает на все следующие вопросы: Какие категориальные ценности? Что происходит, когда в модели машинного обучения передаются категориальные значения? Как закодировать категориальные значения? Мы почти прошли 50% пути к предварительной обработке данных. Сейчас совершенно очевидно, что если нам нужна точность нашей модели машинного обучения, мы должны должным образом заботиться о наших данных и оттачивать их должным образом. На данный момент мы успешно..