Публикации по теме 'scikit-learn'


Оценка отклонения регрессии для каждого входа
Оценка отклонения регрессии для каждого входа Недавно я работал над двумя задачами регрессии, в которых было полезно предсказать достоверность оценки, а также ожидаемое значение для каждого отдельного ввода. Концептуально это просто, но я нашел несколько окончательных ответов и готовых моделей, поэтому поделюсь некоторыми мыслями и экспериментами. Поскольку оценка «достоверности» четко не определена, я расскажу об оценке параметров нормального (гауссовского) распределения: среднего..

Начало работы с машинным обучением: руководство для начинающих по классификации и регрессии с использованием Scikit-Learn
Построение моделей машинного обучения шаг за шагом Область машинного обучения может быть сложной, особенно для тех, кто только начинает. Однако при наличии правильных инструментов и системного подхода разработка моделей машинного обучения может быть на удивление простой. В этом сообщении блога мы рассмотрим шаги, связанные с построением моделей машинного обучения для задач классификации и регрессии, с использованием библиотеки scikit-learn и двух хорошо известных наборов данных,..

Разница между Pipeline и make_pipeline в Scikit-Learn
Часто, работая над проектами по науке о данных, нам необходимо создавать конвейеры для прогнозного моделирования, потому что это делает возможным применение шагов предварительной обработки данных и построение модели по сравнению с ручным выполнением всех этих шагов. К счастью, scikit-learn предоставляет функциональные возможности для построения конвейеров прогнозирования на ходу. Он предоставляет два метода, т.е. Pipeline и make_pipeline . Хотя оба они обеспечивают одинаковую..

Порядковый кодировщик и кодировщик OneHot
Порядковый кодировщик и кодировщик OneHot Как преобразовать текстовые категориальные данные в числовые данные для машинного обучения. Большинство алгоритмов машинного языка предназначены для работы с числами. В этой статье я показываю два популярных метода преобразования текстовых категориальных атрибутов в числа. Во-первых, давайте откроем сохраненный файл pickle, содержащий фрейм данных атрибутов S&P 500, который я использовал в предыдущей статье , и прочитаем ограниченный..

Понимание функций разделения данных в scikit-learn
В этом посте я проведу вас через простое упражнение, чтобы понять два распространенных способа разделения данных на обучающий набор и тестовый набор в scikit-learn. Блокнот Jupyter доступен здесь . Давайте начнем и создадим список чисел от 0 до 9 Python с помощью range (): X = list(range(10)) print (X) [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] Затем мы создаем другой список, который содержит квадратные значения чисел в X, используя понимание списка: y = [x*x for x in X] print (y) [0,..

Написание классификаторов машинного обучения за 10 минут с помощью Python и Sklearn
Независимо от того, являетесь ли вы новичком в мире заработка M ахина L или у вас есть кое-какие ноу-хау, эта статья поможет вам изучить практическую сторону программирования в ML. Обычно машинное обучение бывает следующих типов: Контролируемое обучение Неконтролируемое обучение Обучение с подкреплением В этой статье мы сосредоточимся только на «контролируемом обучении», поскольку это часто является отправной точкой в ​​машинном обучении. Обычно контролируемое обучение - это..

Как обрабатывать нечисловые значения в наборе данных с помощью библиотеки Python Scikit-learn?
Вы новичок и хотите избавиться от нечисловых значений из набора данных. Ну… в таком случае у нас одни и те же проблемы. Я собираюсь объяснить 3 различных метода, которые решат вашу проблему. Категориальные переменные — это типы данных, которые не являются числовыми и состоят из ограниченного числа ответов. Например, вопрос о том, как часто вы занимаетесь спортом: «Никогда», «Редко», «Чаще всего дней» или «Каждый день». В этом случае данные являются категоричными, поскольку ответы..