Что, черт возьми, это за линейная регрессия?
Линейная регрессия — это линейный подход к моделированию взаимосвязи между скалярным откликом (или зависимой переменной) и одной или несколькими независимыми переменными (или независимыми переменными).
Я знаю, что это было грубо!
Давайте сделаем это проще!
Линейная регрессия — это поиск линии регрессии, которая представляет собой прямую линию, задача которой — предсказать отношение** между двумя точками, также известную как линия наилучшего соответствия.
Давайте сделаем это еще проще!
- **отношение — это поведение функций (независимых переменных) по отношению к зависимой переменной.
- y = mx + c,мы все изучали его в старших классах школы, здесь 'x' — независимая переменная, а 'y' — зависимая переменная, потому что это зависит от заданного значения 'x'.
- здесь «m» — наклон линии, а «c» — точка пересечения той же линии.
Звучит достаточно справедливо?
Почему линейная регрессия?
Линейная регрессия предназначена для измерения степени линейной зависимости между двумя переменными. В частности, цель линейной регрессии — «предсказать» значение зависимой переменной на основе значений одной или нескольких независимых переменных.
Наконец-то! как реализовать линейную регрессию.
Первое первым
Импортируйте необходимые библиотеки машинного обучения
Затем загрузите набор данных.
Визуализация наших данных
Теперь получите некоторое представление о наборе данных, построив его график, благодаря библиотеке Matplotlib, которую мы импортировали ранее.
Визуализация ясно показывает линейный характер данных, а это значит, что было бы разумно реализовать на них линейную регрессию.
(i) Разделить набор данных на два дополнительных набора (обучение и тестирование)
Теперь разделите набор данных на обучающие и тестовые наборы, это обязательный шаг с точки зрения машинного обучения, это его сердцевина.
здесь я разделил набор данных на два набора: «тестовый набор» содержит 1/3 количества строк (экземпляров) и остальные в «тренировочном наборе». После применения модели на «тренировочном наборе» я проверю ее работу на «тестовом наборе».
(ii) Подгоните модель к тренировочному набору, просто импортировав ее из сексуальной научной библиотеки «Scikit-Learn».
класс linear_model.
Создайте объект regressor, используя класс LinearRegression().
затем подгоните модель к обучающим данным.
Вывод!
Поздравляем с тем, что зашли так далеко. Кажется, наша модель сработала на удивление хорошо, синяя линия идеально подходит, и теперь, используя ее «наклон» и «пересечение», мы можем легко предсказать зарплату для заданного количества лет опыта.
Спасибо!!!
Полный код этой статьи можно найти на моей странице github.
Проверьте это.
https://github.com/proffdeep/Linear-Regression.git