Линейная регрессия — это модель регрессии для поиска линейной функции или модели, которая выражает взаимосвязь между зависимыми и независимыми переменными. Моделирование в регрессии означает отображение различных концепций с использованием математических функций.

Как мы видим на Рисунке 1, уравнение линейной регрессии содержит одну независимую переменную, одну константу и коэффициент (также известный как вес), и мы пытаемся предсказать зависимую переменную.

В уравнении линейной регрессии мы не можем игнорировать ошибку, также известную как остаток, которая показана на Рисунке 2. Ошибка, также известная как потеря, является штрафом за плохой прогноз. Эта ошибка означает разницу между фактическим значением и прогнозируемым значением, и мы пытаемся минимизировать эту ошибку, насколько это возможно.

Как мы видим на графике выше, у нас есть линия регрессии красного цвета, которая показывает нам прогноз. У нас есть синяя точка в качестве данных, а синяя линия показывает нам ошибку. Например, расстояние между первой синей точкой и красной линией указывает на низкие потери, а вторая синяя точка и красная линия — на высокие потери.

Вы видите, что линия регрессии не начиналась с нуля, что означает смещение, которое показано в уравнении в виде точки пересечения.

Чтобы свести к минимуму эти потери, у нас есть много математических функций.

Это математическая функция, которую мы будем использовать, когда захотим минимизировать ошибки на изображении 4.

  1. Среднеквадратическая ошибка определяется как сумма квадратов разностей между фактическим и прогнозируемым значением, деленная на числа значений.
  2. Среднеквадратическая ошибка определяется как сумма квадратов разностей между фактическим и прогнозируемым значением, деленная на числа значений, и, кроме того, мы извлекаем из нее квадратный корень.

Почему мы берем квадрат значений, потому что мы не хотим отменять положительные и отрицательные значения друг друга.

3. Средняя абсолютная ошибка определяется как сумма различий между фактическим и прогнозируемым значением путем взятия абсолютного значения и деления на числовые значения.

Мы можем легко рассчитать эти математические функции, используя одну из библиотек Python, известную как Numpy, также в библиотеке sklearn есть функция, известная как mean_squared_error.

Этот блог был о линейной регрессии в основном.

Спасибо за чтение.