Публикации по теме 'regression'


Статистические концепции для людей, не разбирающихся в математике — Часть I: Регрессия
Почему люди, не разбирающиеся в математике или статистике, избегают использования простой статистики для помощи в принятии повседневных решений? Моя теория состоит в том, что это по той же причине, по которой я держусь подальше от парусного спорта. Они не знают, как это сделать, и это наполнено непонятными терминами. В этой серии я хочу попытаться демистифицировать некоторые основные статистические концепции, которые, как я думаю, помогут вам принимать более правильные решения. Если..

Начало работы с моделями машинного обучения: полиномиальная регрессия
В серии статей мы уже обсуждали, как работает линейная и логистическая регрессия. В этой статье мы обсудим модель полиномиальной регрессии. Эти модели очень похожи на линейную регрессию, потому что мы используем их для регрессионного моделирования, как мы используем линейную регрессию. Гибкость линии регрессии отличает модель от линейной регрессии, или мы можем сказать, что эта модель использует кривую для моделирования точек данных. В реальной жизни бывают разные случаи, когда мы не..

Работа с сильно коррелированными столбцами в моделях машинного обучения
Простая попытка решения общей проблемы Фон Я работал с набором данных по умолчанию для кредитной карты в рамках проекта учебного курса по науке о данных. Нам пришлось запустить различные алгоритмы машинного обучения, чтобы попытаться предсказать, будет ли кто-то по умолчанию или нет, в основном используя оценку F1 в качестве метрики. Мы попробовали поиск по сетке на основе логистической регрессии гребня и лассо, K ближайших соседей и деревьев решений, чтобы увидеть, какая модель..

Создание универсального конвейера машинного обучения: путешествие с табличными данными
Создание универсального конвейера машинного обучения: путешествие с табличными данными 1. Введение Машинное обучение покорило мир, способствуя улучшениям во многих секторах, от здравоохранения до финансов. Одним из распространенных типов данных, с которым часто сталкиваются профессионалы, включая меня, являются табличные данные. Строки, столбцы, ячейки — этот структурированный формат знаком многим из нас. В этой статье я поделюсь с вами общим конвейером машинного обучения, который..

Обычное руководство по контролируемому обучению с помощью scikit-learn — Многозадачное лассо — обобщенное линейное…
Обычное руководство по контролируемому обучению с помощью scikit-learn — Многозадачные обобщенные линейные модели Lasso (5) Это пятая часть из серии из 92 частей традиционного руководства по обучению с учителем с помощью scikit-learn, написанного с целью овладеть навыками реализации алгоритмов для продуктивного использования и объяснить алгоритмическую логику, лежащую в их основе. Ссылки на все части смотрите в первой статье . Это продолжение обсуждения регрессии лассо ,..

Случайные леса — Объяснение
Пошаговое руководство о том, что делает «случайный лес» случайным лесом. TLDR. Случайные леса — это метод ансамблевого обучения на основе деревьев. Обучаются несколько деревьев решений, каждое из которых использует свои собственные начальные обучающие данные, и совокупность их прогнозов возвращается в качестве прогноза ансамбля. Метод агрегирования зависит от того, используем ли мы случайный лес для регрессии или классификации. Для регрессии мы обычно берем среднее значение..

Различные функции потерь, используемые в регрессии
Функция потерь в регрессии — это математическая функция, которая измеряет разницу между прогнозируемыми значениями и фактическими значениями. Он используется для оценки производительности регрессионной модели и используется в качестве руководства для настройки параметров модели, чтобы делать более точные прогнозы. Среднеквадратическая ошибка (MSE), средняя абсолютная ошибка (MAE) и потеря Хьюбера — все это широко используемые функции потерь в области машинного обучения, которые обычно..