Что, черт возьми, это за линейная регрессия?

Линейная регрессия — это линейный подход к моделированию взаимосвязи между скалярным откликом (или зависимой переменной) и одной или несколькими независимыми переменными (или независимыми переменными).

Я знаю, что это было грубо!

Давайте сделаем это проще!

Линейная регрессия — это поиск линии регрессии, которая представляет собой прямую линию, задача которой — предсказать отношение** между двумя точками, также известную как линия наилучшего соответствия.

Давайте сделаем это еще проще!

  • **отношение — это поведение функций (независимых переменных) по отношению к зависимой переменной.
  • y = mx + c,мы все изучали его в старших классах школы, здесь 'x' — независимая переменная, а 'y' — зависимая переменная, потому что это зависит от заданного значения 'x'.
  • здесь «m» — наклон линии, а «c» — точка пересечения той же линии.

Звучит достаточно справедливо?

Почему линейная регрессия?

Линейная регрессия предназначена для измерения степени линейной зависимости между двумя переменными. В частности, цель линейной регрессии — «предсказать» значение зависимой переменной на основе значений одной или нескольких независимых переменных.

Наконец-то! как реализовать линейную регрессию.

Первое первым

Импортируйте необходимые библиотеки машинного обучения
Затем загрузите набор данных.

Визуализация наших данных

Теперь получите некоторое представление о наборе данных, построив его график, благодаря библиотеке Matplotlib, которую мы импортировали ранее.

Визуализация ясно показывает линейный характер данных, а это значит, что было бы разумно реализовать на них линейную регрессию.

(i) Разделить набор данных на два дополнительных набора (обучение и тестирование)

Теперь разделите набор данных на обучающие и тестовые наборы, это обязательный шаг с точки зрения машинного обучения, это его сердцевина.

здесь я разделил набор данных на два набора: «тестовый набор» содержит 1/3 количества строк (экземпляров) и остальные в «тренировочном наборе». После применения модели на «тренировочном наборе» я проверю ее работу на «тестовом наборе».

(ii) Подгоните модель к тренировочному набору, просто импортировав ее из сексуальной научной библиотеки «Scikit-Learn».

класс linear_model.
Создайте объект regressor, используя класс LinearRegression().
затем подгоните модель к обучающим данным.

Вывод!

Поздравляем с тем, что зашли так далеко. Кажется, наша модель сработала на удивление хорошо, синяя линия идеально подходит, и теперь, используя ее «наклон» и «пересечение», мы можем легко предсказать зарплату для заданного количества лет опыта.

Спасибо!!!

Полный код этой статьи можно найти на моей странице github.
Проверьте это.
https://github.com/proffdeep/Linear-Regression.git