Публикации по тегам regression

Публикации по теме 'regression'

Ридж-регрессия (регуляризация L2)

Гребневая регрессия — это популярный метод линейной регрессии, который используется для решения проблемы мультиколлинеарности (высокой корреляции) между переменными-предикторами. Это регуляризованная версия обычной регрессии методом наименьших квадратов (OLS), в которой коэффициенты переменных-предикторов оцениваются путем минимизации функции потерь, которая включает штрафной член, пропорциональный сумме квадратов значений коэффициентов. Цель гребневой регрессии состоит в том, чтобы..

Всегда сначала рассматривайте модель линейной регрессии в качестве эталона.

Как реализовать логистическую регрессию в Python (с примерами)?

В предыдущей статье я говорил о линейной регрессии. В этой статье я собираюсь исключительно поговорить о логистической регрессии на практике с использованием python. Я собираюсь показать вам, как реализовать логистическую регрессию в python с помощью библиотеки sklearn, и в последнюю очередь я буду использовать библиотеку statsmodels.api. Прежде всего, если вы никогда не используете машинное обучение или ничего не знаете о sklearn, я бы хотел, чтобы вы не пропускали ни одного шага в..

Прогнозирование цен на автомобили с помощью машинного обучения в Python — Портфолио проекта

Использование Pandas, Numpy, Scikit-Learn, Streamlit и Streamlit Cloud Введение Оценка продажных цен автомобилей на аукционе — один из основных проектов по изучению данных, который может помочь вам создать хорошее портфолио. Прочитав эту статью, вы сможете получать различные данные об автомобилях с сайта автомобильных аукционов и прогнозировать цену этих автомобилей, используя различные типы алгоритмов линейной регрессии. Затраченные шаги Веб-скрейпинг сайта автомобильного..

Прогнозирование голосов за комментарии Reddit с помощью машинного обучения

Прогнозирование голосов за комментарии Reddit с помощью машинного обучения В этой статье мы будем использовать Python и пакет scikit-learn, чтобы предсказать количество голосов за комментарий на Reddit. Мы подбираем различные регрессионные модели и сравниваем их эффективность, используя следующие показатели: R² для измерения степени соответствия средняя абсолютная ошибка (MAE) и среднеквадратичная ошибка (RMSE) на тестовом наборе для измерения точности. Эта статья основана..

Попытка получить набор данных Черной пятницы (часть 1)

Набор данных состоит из 550 069 строк и 12 столбцов. Столбцы состоят из следующего: User_ID (непрерывное числовое значение) Product_ID (буквенно-цифровое значение) Пол (двоичный -M / F) Возраст (в ящиках 5 типов: 0–17, 18–25,26–35,36–45,46–50,51–55,55 +) Занятие Категория города (3 типа: A, B, C) Stay_In_Current_City_Years (в 4 категориях: 1,2,3,4+) Семейное положение (двоичное значение) Product_Category_1 (числовое значение) Product_Category_2 (может или может не иметь значения)..

Лассо-регрессия в Python

В этой статье мы углубимся в расширение линейной регрессии, которое называется регрессией Лассо. Мы углубимся в то, что такое регрессия Лассо, и покажем несколько примеров на Python. Чтобы увидеть полные коды, посетите мой репозиторий GitLab или GitHub ниже: Гитлаб: