Публикации по теме 'handling-missing-values'


Предсказать пропущенные значения с оценкой прогноза
Функция, которая возвращает предсказанные пропущенные значения с оценкой предсказания. Если вы занимаетесь традиционным машинным обучением, вы, вероятно, сталкиваетесь с продолжающейся битвой с пропущенными значениями (NaN) в ваших данных. Это имеет место практически в каждом соревновании Kaggle, а также в большинстве наборов табличных данных. там. Здесь я рассмотрю некоторые жизнеспособные подходы. Затем я попытаюсь коснуться аспектов, которые я разработал и которые я вижу..

Как работать с отсутствующими значениями?
Практическое руководство по Kickstarter. В предыдущих статьях я обещал обсудить, как исправить недостающие значения! В этой статье мы рассмотрим различные стратегии противодействия пропущенным значениям. Вы научитесь сравнивать эффективность этих подходов на любом заданном или большей части набора данных. Вступление Согласно Википедии, «В статистике отсутствующие данные или отсутствующие значения возникают, когда для переменной в наблюдении не сохраняется значение данных...

Как обрабатывать отсутствующие значения с помощью Python?
После того, как мы закончили веб-парсинг (процесс извлечения данных из источника), у нас есть данные, но в неструктурированной или необработанной форме (или в неочищенной форме). Что нам нужно сделать сейчас, так это очистить наши данные, чтобы мы могли исследовать дальше. Согласно IBM Data Analytics , вы можете потратить до 80% своего времени на очистку данных . Причина этого трудоемкого процесса заключается в том, что данные в необработанной форме могут иметь некоторые..

Вменение отсутствующих значений
В реальных данных много пропущенных значений. Получение согласованных качественных данных без пропущенных значений — большая головная боль. Причиной отсутствия значений может быть повреждение данных, невозможность записи данных и многое другое. Пример из практики. Например, для опроса о депрессии мы можем предположить все причины отсутствия значений. Вот их немного. 1. нерешительность предоставить информацию 2. Информация в опросе не соответствует действительности 3. Мужчины не..

Прогнозирование скорости усыновления домашних животных с помощью Python — Часть II
Прогнозирование скорости усыновления домашних животных с помощью Python — часть II Этот пост является вторым в серии из трех частей, описывающих мою попытку разработать алгоритмы для прогнозирования возможности усыновления домашних животных, в частности, как быстро животное усыновляется? Вы можете проверить мой последний пост здесь . Прошли годы с тех пор, как я катался на американских горках. Тем не менее, мне казалось, что программа наставничества ChiPy действительно работает на..

Обработка недостающих данных с помощью Python
Реальные данные состоят из пропущенных значений. Данные играют важную роль в процессе анализа. На точность результата влияет полнота наборов данных. В результате обработка недостающих данных и работа с ними является важным этапом в процессе анализа. В этой статье мы обсудим различные подходы к обработке недостающих данных в Python. Данные Для демонстрации мы будем использовать набор данных маммографической массы. Данные доступны в UCI и могут быть загружены здесь . Сначала загрузим..