Добро пожаловать в модуль Линейная регрессия в предыдущем блоге, где я объяснял Предположения линейной регрессии и Метрики оценки модели, используемые для регрессии.

В этом разделе мы начнем с понимания базовой концепции простой линейной регрессии и построим простую модель линейной регрессии в Python.

Широкая повестка дня выглядит следующим образом:

  1. Модели линейной регрессии.
  2. Остатки
  3. Остаточная сумма квадратов (RSS) и R² (R-квадрат) (следите за моим предыдущим блогом)
  4. Линейная регрессия в Python.

Модель машинного обучения можно разделить на следующие три типа в зависимости от выполняемой задачи и характера выходных данных:

  1. Регрессия: прогнозируемая выходная переменная является непрерывной переменной, например. баллы студента
  2. Классификация: Прогнозируемая выходная переменная является категориальной переменной, например. классифицировать входящие электронные письма как спам или ветчину
  3. Кластеризация: нет предопределенного понятия метки, присвоенной сформированным группам/кластерам, например. сегментация клиентов

Таким образом, вы можете классифицировать модель машинного обучения по двум граничным категориям следующим образом:

  1. Контролируемый метод

а) Алгоритм регрессии и классификации подпадает под эти категории.

б) Прошлые данные с меткой, используемой для построения модели.

2) Неконтролируемое обучение

а) Алгоритм кластеризации подпадает под эти категории.

b) Прошлым данным не присваиваются предопределенные метки.

Интуиция

Вы когда-нибудь задумывались, как маркетинговая компания может прогнозировать продажи в зависимости от того, сколько денег они вложили, или, скажем, вы болеете за определенную команду IPL (Индийская премиальная лига) и хотите предсказать, сколько ваша команда забьет в конце матча? и прямо сейчас вы находитесь в середине матча, так как построить модель, как вы делаете этот прогноз.

Чтобы понять регрессию, давайте рассмотрим компанию «X», где у нас есть некоторые предыдущие данные о маркетинговых расходах и продажах за предыдущий год. Теперь вы хотите знать, учитывая эту сумму x долларов или денег, каковы будут продажи.

Теперь вопрос в том, как вы делаете это предсказание?

Да, вы правы, вы строите модель и делаете прогноз, конечно, как руководитель отдела маркетинга или кто-то другой, у вас была бы некоторая интуиция, если бы вы увеличили расходы на маркетинг, вы бы увидели увеличение продаж, но тогда вы хотели бы точно знать, какие продажи вы получите, и вы также хотите знать, есть ли какая-либо связь между расходами на маркетинг и продажами. Если между ними нет связи, то вы не будете вкладывать деньги в достижение продаж.

Начнем с того, что по оси X у нас есть маркетинговый бюджет, а по оси Y у нас есть продажи, и мы просто делаем точечный график с данными за предыдущий год, и вы получите все эти точки здесь. Интересно отметить, что маркетинговый бюджет по оси X связан с осью Y. Ось X маркетинговый бюджет также называется независимой переменной, а продажи по оси Y, которые мы хотим предсказать, называются зависимой переменной, здесь у нас есть одна независимая и одна зависимая переменная.

Подробнее