Публикации по теме 'classification-algorithms'


Контролируемые приложения машинного обучения
Классификация диабета — проблема классификации машинного обучения с учителем В этой записной книжке я применяю контролируемые классификации машинного обучения к набору данных о диабете. Я стремлюсь определить, есть ли у проверенных данных диабет или нет. Я буду использовать KNN, дерево решений, случайный лес, машину опорных векторов, логистическую регрессию и алгоритмы наивного Байеса. Я также проведу оценку всех используемых моделей с помощью матрицы путаницы. Загрузка данных..

Введение в регрессионный анализ
Регрессия - это процесс прогнозирования непрерывных переменных. это тип обучения с учителем. регрессионный анализ - это набор статистических процессов для оценки взаимосвязей между переменными. Это проект из школы данных Gitgirl, которую я сейчас посещаю. Регрессионный анализ фокусируется на взаимосвязи между зависимой переменной и одной или несколькими независимыми переменными. Зависимую переменную можно рассматривать как «состояние», «цель» или «конечную цель», которую мы изучаем и..

Бронирования новых пользователей Airbnb  — «Где новый гость забронирует свое первое путешествие?»
Содержание: · Введение · Деловая проблема · ML постановка бизнес-задачи · Бизнес-ограничения · Набор данных · Показатели эффективности · Обширный EDA и предварительная обработка · Некоторый двумерный анализ · Анализ дат и временных меток · Анализ данных сеанса · Кодирование категориальных столбцов · Моделирующая часть: сравнение моделей, классификатор Custom Ensembler · Прогнозирование окончательного набора данных, предоставленного для конкурса · Kaggle счет..

4-шаговая процедура для оценки производительности вашей модели
Вернуться к истокам Как мы можем сказать, что «эта модель хорошо обобщает», «этот алгоритм работает хорошо» или просто «это хороший»? В этой статье мы рассмотрим методы и показатели, широко используемые в машинном обучении для анализа производительности моделей классификации. Вы спросите: только для классификации? Что ж, в случае регрессии оценка более проста, поскольку обычно она включает только вычисление средней функции потерь, такой как среднеквадратическая ошибка (MSE). Эта..

Случайный лесной классификатор
Блокнот, использованный для этого урока: Нажмите здесь (поставьте лайк, если понравилось😉) Случайный лес — это метаоценка, которая соответствует ряду классификаторов дерева решений для различных подвыборок набора данных и использует усреднение для повышения точности прогнозирования и контроля переобучения. Размер подвыборки управляется параметром max_samples , если bootstrap=True (по умолчанию), в противном случае для построения каждого дерева используется весь набор данных. ~..

Попрощайтесь с традиционной классификацией временных рядов с RISE
Классификация временных рядов (TSC) — это задача присвоения метки класса временному ряду на основе его характеристик. TSC имеет множество приложений в различных областях, таких как здравоохранение, финансы, безопасность и промышленность. Однако TSC также сложен из-за высокой размерности, шума, изменчивости и сложности данных временных рядов. Для TSC было предложено множество алгоритмов, начиная от методов на основе расстояния, которые сравнивают сходство временных рядов с использованием..

Алгоритм K-ближайших соседей (KNN)
Привет снова! Как и было обещано в моей предыдущей статье , мы начнем изучать алгоритмы машинного обучения. И в этом блоге мы поговорим об одном из часто используемых алгоритмов классификации, алгоритме KNN. K-ближайшие соседи — один из самых простых для понимания, но очень важных для понимания алгоритмов классификации в машинном обучении. Его даже называют самым ленивым алгоритмом, и вы узнаете, почему он так называется, прочитав эту статью. Давайте начнем; Для некоторых..