Все вкратце о линейной регрессии

Что вы думаете, когда кто-то спрашивает вас о линейной регрессии? Вы когда-нибудь думали об этом? Пытались обрамлять свои ответы в той ситуации или ломали голову?

Что ж, это слишком сложно, потому что кто-то задает вам только один вопрос, и вы получаете в голову внешние странные вопросы, потому что вы слишком запутались, чтобы сформулировать ответы на этот вопрос.

Итак, давайте посмотрим, что такое линейная регрессия, простыми словами и понятным образом, чтобы в следующий раз, если кто-то спросит вас о линейной регрессии, вы снова не почесали затылок.

Что такое линейная регрессия?

Линейная регрессия — это алгоритм машинного обучения (под наблюдением), в котором прогнозируемый результат является непрерывным и имеет постоянный наклон.

Линейный регрессионный анализ используется для прогнозирования значения переменной на основе значения другой переменной.

Переменная, которую вы хотите предсказать, называется зависимой переменной. Переменная, которую вы используете для предсказания значения другой переменной, называется независимой переменной.

Линейная регрессия является основным и широко используемым типом прогнозного анализа. Он используется для прогнозирования значений в непрерывном диапазоне (например, продажи, цена и т. д.), а не для классификации их по категориям (например, кошка, собака и т. д.). Существует два основных типа линейной регрессии:

(i) Простая линейная регрессия

(ii) Мультилинейная регрессия

(iii) Логистическая регрессия

Давайте не будем сейчас вдаваться в типы.

Линия линейной регрессии имеет уравнение вида:

Y = a + bX

где X — независимая переменная, а Y — зависимая переменная. Наклон линии равен b, а a — точке пересечения (значение y, когда x = 0).

К какой линии подходит линейная регрессия?

Линейная регрессия заключается в поиске наиболее подходящей прямой через точки.

Наиболее подходящая линия называется линией регрессии.

Метод линейной регрессии можно применятьв различных программах и средах, в том числе:

R линейная регрессия
Линейная регрессия MATLAB
Линейная регрессия Склеарна
Линейная регрессия Python
Линейная регрессия Excel

Важность линейной регрессии:

Модели линейной регрессии относительно просты и предоставляют простую для интерпретации математическую формулу, которая может генерировать прогнозы.

Линейная регрессия может применяться в различных областях бизнеса и научных исследований.

Вы обнаружите, что линейная регрессия используется во всем, от биологических, поведенческих, экологических и социальных наук до бизнеса.

Модели линейной регрессии стали проверенным способом научного и надежного прогнозирования будущего. Поскольку линейная регрессия является давно установленной статистической процедурой, свойства моделей линейной регрессии хорошо изучены и могут быть обучены очень быстро.

Выводы:

Прежде чем пытаться выполнить линейную регрессию, необходимо убедиться, что ваши данные могут быть проанализированы с помощью этой процедуры.

Ваши данные должны пройти через определенные необходимые предположения.

Вот как вы можете проверить эти предположения:

1. Переменные следует измерять на непрерывном уровне. Примерами непрерывных переменных являются время, продажи, вес и результаты тестов.

2. Используйте диаграмму рассеяния, чтобы быстро выяснить, существует ли линейная связь между этими двумя переменными.

3. Наблюдения должны быть независимы друг от друга (то есть не должно быть зависимости).

4. В ваших данных не должно быть значительных выбросов.

5. Проверка гомоскедастичности — статистическая концепция, согласно которой дисперсии вдоль наиболее подходящей линии линейной регрессии остаются одинаковыми на всем протяжении этой линии.

6. Остатки (ошибки) наиболее подходящей линии регрессии подчиняются нормальному распределению.