Здравствуйте, энтузиасты машинного обучения!

Линейная регрессия, пожалуй, один из самых известных и хорошо изученных алгоритмов в статистике и машинном обучении.

Линейную регрессию можно определить как линейную модель, например модель, которая предполагает линейную зависимость между входными переменными (x) и единственной выходной переменной (y).

Более конкретно, это y может быть вычислено из линейной комбинации входных переменных (x).

Существуют различные платформы для машинного обучения, на которых вы можете строить свои данные и работать с ними. Но я предпочитаю Google Colab для начинающих, так как он особенно хорошо подходит для машинного обучения, анализа данных и образования.

Итак, сегодня я подробно расскажу вам, шаг за шагом, Как построить график в Google Colab для модели линейной регрессии.

Давайте начнем

Прежде всего, мы начнем с того, что возьмем случайные данные и поместим их в ячейку.

Здесь (0,1) - это первый набор x и y. (1,2) - второй набор x и y.

И так далее…

Итак, следующее, что мы здесь сделаем, это то, что мы попытаемся построить график для заданных наборов данных, и для его построения мне нужны отдельные списки x и y.

Теперь, чтобы построить его, я буду использовать библиотеку под названием matplotlib, а также буду использовать здесь подбиблиотеку под названием pyplot. Давайте назовем его plt.

Следующее, что мне нужно сделать, это разбросать график, и я хочу построить свои x и y; и именно этого хочет matplotlib ..!

Обратите внимание, что 1-й, 2-й и 3-й этапы находятся в трех разных ячейках. Итак, вот как будет выглядеть ваш блокнот:

Следующим шагом является отделение моих значений x и значений y от наборов данных. А когда дело доходит до данных в Python; лучше всего использовать другую библиотеку под названием pandas

Поскольку мы импортировали панды, давайте получим эти x и y в панды Фрейм данных. Разделите его на столбцы, включая столбец x и столбец y.

В Google Colab вы можете просто распечатать что-нибудь, просто набрав это в последней строке ячейки.

Итак, если вы просто введете данные здесь, в последней строке, вы сможете увидеть, как выглядит этот фрейм данных.

А теперь давайте запустим код… !!

Как видите, теперь у меня есть стол. Крайний левый элемент - это индекс. И все в Python мы считаем от 0.

До сих пор это выглядит неплохо…!

Теперь все, что мне нужно, это получить мои x и y из фрейма данных и сообщить ему, что я хочу использовать свой столбец с меткой «x» для x и столбец "y" для y.

Посмотрим, как это работает:

Это круто..!!!

Следующее, что мне нужно сделать, это попытаться создать предсказывающую модель. Проще говоря, я хочу создать модель линейной регрессии.

Итак, я хочу получить некоторый прогноз y, и я напишу это в терминах точки пересечения оси y и наклона линии. Теперь давайте установим их оба в 1 и посмотрим, что произойдет.

Это всего лишь предположение о моих параметрах в моей модели машинного обучения.

Мне также нужно построить график моего прогнозируемого y с моими значениями x. Теперь я хочу изобразить его как линию, поэтому я буду использовать здесь plot вместо scatter, который я использовал до.

Ууу !! Выглядит неплохо, но, наверное, я мог бы сделать немного лучше ..!

Может быть, мой уклон должен быть немного выше.

Итак, давайте изменим значение c и m и проверим его еще раз.

ОККК! Этот вид стал намного лучше, чем раньше.

Было бы неплохо иметь какие-то меры для определения того, лучше или хуже у меня, потому что сейчас я просто смотрю на это.

Итак, было бы хорошо вычислить ОШИБКУ…! Ошибка должна быть разницей между фактическими точками, которые здесь являются моими точками данных, и теми, которые я предсказал.

Теперь, чтобы вычислить среднее значение ошибки, мне нужна другая библиотека с именем numpy. Итак, я собираюсь импортировать numpy как np

А теперь я буду использовать функцию mean в numpy, которая поможет мне получить среднее значение всех этих значений.

Да, ок. Теперь у меня среднее значение = 0,05, и график выглядит очень хорошо. Верно?

Для простоты я показываю вам код целиком, и вот как ваш блокнот Google Colab будет выглядеть в конце. Разве не так просто?

Итак, я собираюсь остановиться здесь. А теперь почему бы вам не написать код и не попробовать поиграть с этими двумя параметрами и не построить новый график модели линейной регрессии.

Удачного обучения с Colab… !!!