Линейная регрессия — это линейный подход к моделированию взаимосвязи между входными и выходными данными.

Допустим, у нас есть такой набор данных:

Каждый вход имеет соответствующий выход. Мы предполагаем, что связь между входом и выходом является линейной, поэтому рисуем случайную синюю линию. Мы измеряем расстояние между данными и синей линией. Чтобы предсказать хорошую взаимосвязь между входом и выходом, каждое расстояние между данными и синей линией должно быть как можно короче.

Поэтому мы пробуем другое направление синей линии, чтобы соответствовать требованию. Синяя линия, которая соответствует требованию, является нашей моделью. Основываясь на этой модели, мы можем использовать ее для прогнозирования нового ввода!

Чтобы быть более конкретным, в обычной линейной регрессии наименьших квадратов мы вычисляем квадрат расстояния и суммируем их все. Затем мы пытаемся найти минимальное значение методом градиентного спуска. Таким образом, мы получаем наклон и точку пересечения уравнения. В результате это наша модель линейной регрессии!

Вот демонстрационный код для линейной регрессии с использованием Scikit-learn.
http://scikit-learn.org/stable/auto_examples/linear_model/plot_ols.html