Когда мы делаем шаг к машинному обучению, мы сталкиваемся с различными терминами.

Один из терминов, который распространяется повсюду, — это «Регрессия», и когда этот термин появляется, люди начинают со своего тяжелого оружия Тета, Веса, Предвзятости и т. д. !!!

И, в конце концов, учащийся заканчивает с огромными терминами Theta, Weights, Bias, но без ясности.

Давайте посмотрим на этом примере:

Представьте, что вы заказали такси Uber и хотите поехать из Пуны в Гоа.

Теперь вы хотите знать, как это пример регрессии? Когда вы заказываете такси, есть некоторая базовая плата за проезд в рупиях, которую вы должны заплатить, либо вы едете в Гоа, либо до Мумбаи. Это сумма, которую вы должны заплатить, садясь в такси. Другие тарифы, когда вы едете в Мумбаи, будут иметь некоторую сумму «y1», а когда вы едете в Гоа, вы должны заплатить сумму «y2».

По мере увеличения расстояния впоследствии увеличивается и стоимость проезда. Таким образом, мы можем сделать вывод, что общая стоимость проезда зависит от расстояния с базовым тарифом.

Тариф:

Для Мумбаи: y1 = (d1)*x + b

Здесь d1 = расстояние от Пуны до Мумбаи

Для Гоа y2 = (d2)*x + b

Здесь d2 = расстояние от Пуны до Гоа

Общееуравнение,

Общий тариф = расстояние * соотношение + базовый тариф

*ratio = отношение цены к расстоянию, которое необходимо оплатить

Теперь давайте свяжем это с регрессией. Взгляните на основное уравнение регрессии с одной переменной,

который :

где «Y» — это результат, в нашем случае это «общая стоимость проезда», «m» — это наклон, который является «отношением», а «x» — это ввод, который в нашем случае является «расстоянием», а «b» обозначается термином «предвзятость», для нас это базовый тариф.

  • * Примечание: этот наклон m и смещение b называются весами.

Теперь давайте продвинемся на шаг вперед,

Хотя, если вы путешествуете из Пуны в Мумбаи или из Пуны в Гоа, вы получаете одинаковую общую стоимость проезда.

Как так?

Как так?

Как так?

Но, тем не менее, справедливость оказывается почти одинаковой для обоих такси, такси, курсирующего из Пуны в Гоа, и такси, курсирующего из Пуны в Мумбаи. Потому что появляется новая функция, которая называется временем, поскольку время ожидания в пути увеличивает стоимость проезда, а также впоследствии увеличивает каждую минуту, потраченную такси на пробки. Uber взимает некоторую сумму «z» в минуту.

Общий тариф = Базовый тариф + (Расстояние*x) + (Время*y)

Здесь "Общий тариф" является зависимой переменной. «Расстояние» и «Время» — независимые переменные, «x» — количество на единицу расстояния, а «y» — количество в единицу времени. Базовый тариф — это условное обозначение.

Теперь, по мере увеличения расстояния стоимость проезда также увеличивается, и, аналогично, по мере увеличения времени поездки стоимость проезда также увеличивается.

Таким образом, это отношение зависимости зависимой переменной, которой является «Общая стоимость проезда», от независимых переменных, таких как «Расстояние» и «Время».

Базовый тариф — это постоянное условие, добавляемое к общему тарифу, чтобы сбалансировать прибыль и убытки Uber от поездки. Это добавляется извне с бизнес-знанием, поэтому этот термин называется термином смещения.

Регрессия, что это такое? зачем нам это нужно?

Регрессия:

Это статистическая мера, которая пытается определить силу связи между одной зависимой переменной (обычно обозначаемой буквой Y или известной как результат) и рядом других изменяющихся переменных (известных как независимая переменная, предикторы", "ковариаты" или "функции").

Он показывает, как независимая переменная численно связана с зависимой переменной.

Регрессионный анализ помогает предсказывать или прогнозировать значение конечного результата на основе взаимосвязи с независимой переменной.

Эта связь между независимой переменной и зависимой переменной также известна как «шаблон в данных». Затем мы пытаемся построить модель, которая изучает шаблон в данных, которые прогнозирует будущий результат с набором входных данных.

Точки данных: точки, используемые для построения линии регрессии.

Линия регрессии: это наиболее подходящая линия, которая подходит путем изучения «отображения» или «функциональной аппроксимации» между зависимой и независимой переменной из данных.

Фактическая функция аппроксимации всегда будет иметь некоторый «термин ошибки или невязку», который обозначается термином эпсилон ( ). Это связано с наличием шума в данных.

Типы ошибок

  • Средняя абсолютная ошибка
  • Среднеквадратическая ошибка
  • Средняя абсолютная ошибка в процентах
  • Средняя процентная ошибка
  • Средняя квадратическая ошибка