Публикации по теме 'missing-values'


Предсказать пропущенные значения с оценкой прогноза
Функция, которая возвращает предсказанные пропущенные значения с оценкой предсказания. Если вы занимаетесь традиционным машинным обучением, вы, вероятно, сталкиваетесь с продолжающейся битвой с пропущенными значениями (NaN) в ваших данных. Это имеет место практически в каждом соревновании Kaggle, а также в большинстве наборов табличных данных. там. Здесь я рассмотрю некоторые жизнеспособные подходы. Затем я попытаюсь коснуться аспектов, которые я разработал и которые я вижу..

Как работать с отсутствующими значениями?
Практическое руководство по Kickstarter. В предыдущих статьях я обещал обсудить, как исправить недостающие значения! В этой статье мы рассмотрим различные стратегии противодействия пропущенным значениям. Вы научитесь сравнивать эффективность этих подходов на любом заданном или большей части набора данных. Вступление Согласно Википедии, «В статистике отсутствующие данные или отсутствующие значения возникают, когда для переменной в наблюдении не сохраняется значение данных...

Методы вменения отсутствующих значений в R
Всем привет !! Здесь мы узнаем о концепции отсутствующих ценностей, о том, как они возникают и как с ними можно работать или лечить, чтобы получить точные и эффективные результаты. Для успешного управления данными важно понимать концепцию пропущенных значений. Если аналитик неправильно обрабатывает недостающие значения, он может сделать неточный вывод о данных. Таким образом, результат, полученный аналитиком, может отличаться от результатов, в которых присутствуют пропущенные значения...

KNNImputer для заполнения недостающих данных при предварительной обработке данных
Алгоритм K-ближайших соседей (KNN) для обработки недостающих данных K-Nearest Neighbours (далее KNN) — это контролируемый алгоритм машинного обучения, который использует k количество ближайших (ближайших) соседей для классификации экземпляра в соответствующий класс. . Соседи экземпляра находятся с использованием евклидова расстояния. Евклидово расстояние между двумя точками данных рассчитывается по следующей формуле. x = (x1, x2, …, xn) y = (y1, y2,…, yn) n — размер..

Начало работы с R - 1
Эта серия предназначена для начинающих R, которые ищут быстрое введение в основы R. Она охватывает основы R, включая типы данных, управляющие структуры, циклы, функции и расширенные структуры данных. Если вы уже знакомы с этими темами и ищете исчерпывающее введение по всем важным темам статистики и машинного обучения с использованием R. Пожалуйста, начните со следующей серии, в которой обсуждаются все необходимые темы, связанные с наукой о данных. Много способов чтения данных в R -..