Публикации по теме 'classification-algorithms'
Контролируемые приложения машинного обучения
Классификация диабета — проблема классификации машинного обучения с учителем
В этой записной книжке я применяю контролируемые классификации машинного обучения к набору данных о диабете. Я стремлюсь определить, есть ли у проверенных данных диабет или нет. Я буду использовать KNN, дерево решений, случайный лес, машину опорных векторов, логистическую регрессию и алгоритмы наивного Байеса. Я также проведу оценку всех используемых моделей с помощью матрицы путаницы.
Загрузка данных..
Введение в регрессионный анализ
Регрессия - это процесс прогнозирования непрерывных переменных. это тип обучения с учителем. регрессионный анализ - это набор статистических процессов для оценки взаимосвязей между переменными.
Это проект из школы данных Gitgirl, которую я сейчас посещаю.
Регрессионный анализ фокусируется на взаимосвязи между зависимой переменной и одной или несколькими независимыми переменными. Зависимую переменную можно рассматривать как «состояние», «цель» или «конечную цель», которую мы изучаем и..
Бронирования новых пользователей Airbnb — «Где новый гость забронирует свое первое путешествие?»
Содержание:
· Введение
· Деловая проблема
· ML постановка бизнес-задачи
· Бизнес-ограничения
· Набор данных
· Показатели эффективности
· Обширный EDA и предварительная обработка
· Некоторый двумерный анализ
· Анализ дат и временных меток
· Анализ данных сеанса
· Кодирование категориальных столбцов
· Моделирующая часть: сравнение моделей, классификатор Custom Ensembler
· Прогнозирование окончательного набора данных, предоставленного для конкурса
· Kaggle счет..
4-шаговая процедура для оценки производительности вашей модели
Вернуться к истокам
Как мы можем сказать, что «эта модель хорошо обобщает», «этот алгоритм работает хорошо» или просто «это хороший»?
В этой статье мы рассмотрим методы и показатели, широко используемые в машинном обучении для анализа производительности моделей классификации.
Вы спросите: только для классификации?
Что ж, в случае регрессии оценка более проста, поскольку обычно она включает только вычисление средней функции потерь, такой как среднеквадратическая ошибка (MSE). Эта..
Случайный лесной классификатор
Блокнот, использованный для этого урока: Нажмите здесь (поставьте лайк, если понравилось😉)
Случайный лес — это метаоценка, которая соответствует ряду классификаторов дерева решений для различных подвыборок набора данных и использует усреднение для повышения точности прогнозирования и контроля переобучения. Размер подвыборки управляется параметром max_samples , если bootstrap=True (по умолчанию), в противном случае для построения каждого дерева используется весь набор данных. ~..
Попрощайтесь с традиционной классификацией временных рядов с RISE
Классификация временных рядов (TSC) — это задача присвоения метки класса временному ряду на основе его характеристик. TSC имеет множество приложений в различных областях, таких как здравоохранение, финансы, безопасность и промышленность. Однако TSC также сложен из-за высокой размерности, шума, изменчивости и сложности данных временных рядов.
Для TSC было предложено множество алгоритмов, начиная от методов на основе расстояния, которые сравнивают сходство временных рядов с использованием..
Алгоритм K-ближайших соседей (KNN)
Привет снова! Как и было обещано в моей предыдущей статье , мы начнем изучать алгоритмы машинного обучения. И в этом блоге мы поговорим об одном из часто используемых алгоритмов классификации, алгоритме KNN.
K-ближайшие соседи — один из самых простых для понимания, но очень важных для понимания алгоритмов классификации в машинном обучении. Его даже называют самым ленивым алгоритмом, и вы узнаете, почему он так называется, прочитав эту статью.
Давайте начнем;
Для некоторых..