Публикации по теме 'data-preprocessing'
Предварительная обработка набора данных перед использованием модели классификации KNN
Я расскажу об идее KNN, а затем перейду к нашей основной теме «удаление потенциально опасных примеров из обучающей выборки».
В этой статье предполагается, что читатель имеет базовое представление о таких терминах, как классификаторы, примеры обучения и тестирования, вектор признаков, евклидово расстояние .
Основная идея классификатора KNN:
Два очень похожих друг на друга растения, вероятно, представляют один и тот же вид; аналогично, довольно часто пациенты, жалующиеся на..
Сравнительный анализ алгоритмов машинного обучения
Машинное обучение - это приложение искусственного интеллекта (ИИ), которое дает системам возможность автоматически учиться и совершенствоваться на основе опыта без явного программирования.
Алгоритмы машинного обучения часто делятся на контролируемые и неконтролируемые.
Что такое машинное обучение с учителем?
При обучении с учителем вы обучаете машину, используя данные, которые хорошо помечены . Это означает, что некоторые данные уже помечены правильным ответом. Это можно..
Масштабирование функций и его важность в предварительной обработке данных. Нормализация и стандартизация.
Масштабирование функций
Масштабирование признаков относится к методам или методам, используемым для нормализации диапазона независимых переменных в наших данных, или, другими словами, к методам установки диапазона значений признаков в пределах аналогичного масштаба. Масштабирование признаков обычно является последним шагом в конвейере предварительной обработки данных, выполняемым непосредственно перед обучением алгоритмов машинного обучения .
Величина функции имеет значение, потому..
Предварительная обработка данных
Реализация
В основе машинного обучения лежит обработка данных. Ваши инструменты машинного обучения настолько же хороши, насколько и качество ваших данных . В этом блоге рассматриваются различные этапы очистки данных . Ваши данные должны пройти несколько этапов, прежде чем их можно будет использовать для прогнозирования.
Набор данных для этого блога можно получить здесь .
Этапы предварительной обработки данных:
Импорт необходимых библиотек Импорт набора данных..
Конвейер для предварительной обработки текстовых данных
Используйте Python для упрощения всей подготовительной работы к моделированию с использованием текстовых данных
Гитхаб ссылка
Введение
Перейдите непосредственно к разделу «Конвейер», если он вас больше интересует, чем узнать о быстрой мотивации, стоящей за ним: Конвейер предварительной обработки текста (половина блога).
Я рассматривал возможность машинного обучения текстовых данных, но есть некоторые этапы предварительной обработки данных, уникальные для текстовых данных, к..
Предварительная обработка данных для машинного обучения
Предварительная обработка данных — это метод, который используется для преобразования необработанных данных в чистый набор данных. Другими словами, всякий раз, когда данные собираются из разных источников, они собираются в необработанном формате, что невозможно для анализа.
Необходимость предварительной обработки данных:
Для достижения лучших результатов от прикладной модели в проектах машинного обучения формат данных должен быть правильным. Некоторой указанной модели машинного..
Шесть шагов для оттачивания ваших данных: предварительная обработка данных, часть 4
Это руководство отвечает на все следующие вопросы:
Какие категориальные ценности? Что происходит, когда в модели машинного обучения передаются категориальные значения? Как закодировать категориальные значения?
Мы почти прошли 50% пути к предварительной обработке данных.
Сейчас совершенно очевидно, что если нам нужна точность нашей модели машинного обучения, мы должны должным образом заботиться о наших данных и оттачивать их должным образом.
На данный момент мы успешно..