Введение в логистическую регрессию

Введение

Логистическая регрессия формула классификации, назначить наблюдения в отдельный набор классов. Ряд образцов вопросов классификации электронной почты спам или не спам, он-лайн транзакций мошенничества или не мошенничество, рост злокачественной или доброкачественной. логистическая регрессия прообразы его выход виктимизации логистическая сигмовидной выполнить, чтобы вернуться значение правдоподобия.

Логистическая регрессия является древней и классической прикладной математикой моделью, которая была широко используется в академии и промышленности. в отличие от линейной регрессии, который используется для создания прогноза на цифровой ответ, предложение регрессия используется для решения задачи классификации. Например, как только человек применяет кредит в банке, банк увлечен, может ли это смертный по умолчанию в будущем? (По умолчанию или нет по умолчанию).

Как это работает

Логистическая регрессия измеряет связь между переменной величиной (наш ярлык, что мы хотели бы предсказать) и, следовательно, один или много фрилансеров переменных (наши возможности), путем оценки эксплуатации шансы это основной сигмовидной функции.

Эти вероятности должны быть затем перестроены в двоичные значения так, чтобы действительно построить прогноз. Это может быть задачей логистической функции, также известная как сигмовидная функция. Сигмовидный-Function является образуются кривой, которая будет принимать любой вещественный диапазон и отобразить его в ценность между варьироваться от нуля до единицы, однако он никогда не конкретно в этих пределах. Эти значения между 0 и 1 будут затем реконструированы в ноль или один с использованием порогового классификатор.

На приведенном ниже рисунке показаны шаги, логистическая регрессия проходит, чтобы дать вам ваш желаемый результат.

Ниже вы можете увидеть, как логистическая функция (функция сигмовидной) выглядит следующим образом:

Мы хотим, чтобы максимизировать вероятность того, что случайная информация получает распознаны, что называется наиболее правдоподобия. Максимального правдоподобия Оценка может быть общий подход к оценке параметров в прикладной математике моделей. мы сможем максимизировать вероятность плохого обращения совершенно разные стратегии, как алгоритмическая программа улучшения. Метод Ньютона является таким алгоритмом и может быть приучен уведомлением максимума (или минимум) из множества различных функций, а также функция правдоподобия. а не метод Ньютона, вы можете использовать совместно градиентный спуск.

Когда его использовать

Как я уже упоминал, логистическая регрессия разделяет ваш ввод на 2 категории линейной границей, по одной для каждого класса. поэтому необходимо, чтобы ваши знания были линейно разделимы, как точки данных на изображении ниже:

Другими словами: у вас должна быть доверительная логистическая регрессия виктимизации, когда ваша переменная Y принимает только два значения (например, когда вы сталкиваетесь с проблемой классификации). мы можем использовать логистическую регрессию в следующих случаях:

Кредитный скоринг
Бронирование отеля
Игры

Введение в логистическую регрессию