Здравствуйте, энтузиасты машинного обучения!
Линейная регрессия, пожалуй, один из самых известных и хорошо изученных алгоритмов в статистике и машинном обучении.
Линейную регрессию можно определить как линейную модель, например модель, которая предполагает линейную зависимость между входными переменными (x) и единственной выходной переменной (y).
Более конкретно, это y может быть вычислено из линейной комбинации входных переменных (x).
Существуют различные платформы для машинного обучения, на которых вы можете строить свои данные и работать с ними. Но я предпочитаю Google Colab для начинающих, так как он особенно хорошо подходит для машинного обучения, анализа данных и образования.
Итак, сегодня я подробно расскажу вам, шаг за шагом, Как построить график в Google Colab для модели линейной регрессии.
Давайте начнем
Прежде всего, мы начнем с того, что возьмем случайные данные и поместим их в ячейку.
Здесь (0,1) - это первый набор x и y. (1,2) - второй набор x и y.
И так далее…
Итак, следующее, что мы здесь сделаем, это то, что мы попытаемся построить график для заданных наборов данных, и для его построения мне нужны отдельные списки x и y.
Теперь, чтобы построить его, я буду использовать библиотеку под названием matplotlib, а также буду использовать здесь подбиблиотеку под названием pyplot. Давайте назовем его plt.
Следующее, что мне нужно сделать, это разбросать график, и я хочу построить свои x и y; и именно этого хочет matplotlib ..!
Обратите внимание, что 1-й, 2-й и 3-й этапы находятся в трех разных ячейках. Итак, вот как будет выглядеть ваш блокнот:
Следующим шагом является отделение моих значений x и значений y от наборов данных. А когда дело доходит до данных в Python; лучше всего использовать другую библиотеку под названием pandas
Поскольку мы импортировали панды, давайте получим эти x и y в панды Фрейм данных. Разделите его на столбцы, включая столбец x и столбец y.
В Google Colab вы можете просто распечатать что-нибудь, просто набрав это в последней строке ячейки.
Итак, если вы просто введете данные здесь, в последней строке, вы сможете увидеть, как выглядит этот фрейм данных.
А теперь давайте запустим код… !!
Как видите, теперь у меня есть стол. Крайний левый элемент - это индекс. И все в Python мы считаем от 0.
До сих пор это выглядит неплохо…!
Теперь все, что мне нужно, это получить мои x и y из фрейма данных и сообщить ему, что я хочу использовать свой столбец с меткой «x» для x и столбец "y" для y.
Посмотрим, как это работает:
Это круто..!!!
Следующее, что мне нужно сделать, это попытаться создать предсказывающую модель. Проще говоря, я хочу создать модель линейной регрессии.
Итак, я хочу получить некоторый прогноз y, и я напишу это в терминах точки пересечения оси y и наклона линии. Теперь давайте установим их оба в 1 и посмотрим, что произойдет.
Это всего лишь предположение о моих параметрах в моей модели машинного обучения.
Мне также нужно построить график моего прогнозируемого y с моими значениями x. Теперь я хочу изобразить его как линию, поэтому я буду использовать здесь plot вместо scatter, который я использовал до.
Ууу !! Выглядит неплохо, но, наверное, я мог бы сделать немного лучше ..!
Может быть, мой уклон должен быть немного выше.
Итак, давайте изменим значение c и m и проверим его еще раз.
ОККК! Этот вид стал намного лучше, чем раньше.
Было бы неплохо иметь какие-то меры для определения того, лучше или хуже у меня, потому что сейчас я просто смотрю на это.
Итак, было бы хорошо вычислить ОШИБКУ…! Ошибка должна быть разницей между фактическими точками, которые здесь являются моими точками данных, и теми, которые я предсказал.
Теперь, чтобы вычислить среднее значение ошибки, мне нужна другая библиотека с именем numpy. Итак, я собираюсь импортировать numpy как np
А теперь я буду использовать функцию mean в numpy, которая поможет мне получить среднее значение всех этих значений.
Да, ок. Теперь у меня среднее значение = 0,05, и график выглядит очень хорошо. Верно?
Для простоты я показываю вам код целиком, и вот как ваш блокнот Google Colab будет выглядеть в конце. Разве не так просто?
Итак, я собираюсь остановиться здесь. А теперь почему бы вам не написать код и не попробовать поиграть с этими двумя параметрами и не построить новый график модели линейной регрессии.