Является ли логистическая регрессия действительно линейной моделью?

Введение

Логистическая регрессия – это широко используемый метод статистического моделирования в различных областях, включая машинное обучение, социальные науки и здравоохранение. Его часто считают основным инструментом для решения задач бинарной классификации.

Несмотря на свою популярность, существует интригующий вопрос, связанный с логистической регрессией — парадокс линейности. На первый взгляд логистическая регрессия кажется линейной моделью из-за ее названия и математической формулировки. Однако, углубляясь, мы обнаруживаем нелинейность скрытую в его структуре.

Это сложное взаимодействие между линейностью и нелинейностью вызвало споры в сообществе специалистов по данным, которые ставят под сомнение истинную природу логистической регрессии, можно ли ее все еще классифицировать (каламбур ) в виде линейной модели. В этой статье я буду ссылаться на бинарную классификацию для облегчения понимания.

Линейный фонд

Чтобы понять основы логистической регрессии, мы начнем с линейной регрессии — хорошо зарекомендовавшего себя метода прогнозирования непрерывных числовых значений. Линейная регрессия моделирует взаимосвязь между входными объектами и целевой переменной с помощью линейного уравнения.

В логистической регрессии мы используем аналогичную концепцию, но вместо прогнозирования непрерывных значений мы фокусируемся на оценке вероятности бинарного результата.

Парадокс линейности

На первый взгляд, математическая формулировка логистической регрессии напоминает линейную регрессию, которая выводит непрерывную переменную отклика.

Это сходство приводит к предположению, что логистическая регрессия является линейной моделью. Однако это предположение несколько ошибочно.

Линейность в логистической регрессии относится к взаимосвязи между предикторами и логарифмом шансов (логарифм шансов) переменной ответа, а не отношения между предикторами и самой переменной ответа.

Линейность в логистической регрессии относится к взаимосвязи между предикторами и логарифмом шансов (логарифм шансов) переменной ответа, а не отношения между предикторами и самой переменной ответа.

Преобразование, выполняемое логистической функцией, вводит нелинейный элемент, усложняющий интерпретацию и анализ моделей логистической регрессии.

Знакомство с сигмовидной функцией:

Сигмоидальнаяфункция, также известная как логистическая функция, является ключевым элементом, который преобразует линейную комбинацию входных признаков в ограниченную вероятность между 0 и 1. сильный>. Он принимает форму:

P(y=1|x) = 1 / (1 + e^(-z))

где P(y=1|x) или S(x) или φ(x) представляет собой вероятность того, что целевая переменнаяe равна 1, учитывая входные признаки (x), а zобозначает линейную комбинацию входных объектов с соответствующими весами.

Сигмоидальная кривая имеет S-образную форму,привнося в модель нелинейность и позволяя фиксировать сложные взаимосвязи между переменными.

Нелинейное преобразование:

Чтобы лучше понять нелинейность логистической регрессии, давайте рассмотрим простой пример.

Предположим, у нас есть бинарная переменная отклика, например "успех" или "неудача", и одна переменная-предиктор X. В модели линейной регрессии мы бы напрямую предсказывали переменная отклика с использованием линейной зависимости:

Y = β₀ + β₁X

Однако в логистической регрессии логарифмические шансы на успех моделируются как линейная комбинация предикторов: log(шансы) = β₀ + β₁X

Эта линейная зависимость затем преобразуется с помощью логистической функции, преобразуя логарифмические шансы в вероятность:

P(Y=1) = 1 / (1 + exp(-(β₀ + β₁X)))

Нелинейность возникает из-за сигмовидного преобразования, которое отображает линейную зависимость на шкале вероятности.

Можно утверждать, что сигмовидная функция по своей сути вносит нелинейность в модель логистической регрессии, оспаривая ее классификацию как линейной модели.

Эта нелинейность позволяет логистической регрессии фиксировать сложные закономерности и взаимодействия между переменными, с которыми линейные модели не могут эффективно справиться.

Линейные границы принятия решений:

Несмотря на наличие нелинейности в логистической регрессии, важно отметить, что границы решений, разделяющие классы, по-прежнему линейны.

Линейность возникает из-за того, что граница решения определяется пороговым значением 0,5 на сигмовидной кривой. Это означает, что логистическая регрессия проводит линейные границы решений во входном пространстве признаков, разделяя его на области, соответствующие разным классам.

Сложность и гибкость модели:

Хотя сигмовидное преобразование вводит нелинейность, логистическая регрессия по-прежнему считается относительно простой и интерпретируемой моделью по сравнению с более сложными нелинейными моделями, такими как нейронные сети.

Споры о линейности в логистической регрессии вращаются вокруг того, в какой степени модель фиксирует сложные отношения между переменными и обеспечивает ли она достаточную гибкость для точных прогнозов.

Роль функциональной инженерии:

Чтобы устранить ограничения линейности, проектирование признаков играет решающую роль в логистической регрессии.

Создавая нелинейные объекты с помощью преобразований, взаимодействий или полиномиальных расширений, модель может отображать более сложные отношения, выходящие за рамки линейных условий.

Инжиниринг признаков позволяет логистической регрессии косвенно использовать силу нелинейностей, еще больше расширяя возможности обработки сложных закономерностей в данных.

Заключение:

Сущность линейности, связанной с логистической регрессией, подчеркивает сложную взаимосвязь между линейностью и нелинейностью в этом популярном алгоритме классификации.

Парадокс линейности возникает из-за неправильного представления о том, что логистическая регрессия следует той же линейной структуре, что и ее аналог.

На самом деле логистическая регрессия сочетает линейные отношения между предикторами и логарифмическими шансами с нелинейностью, вызванной логистической функцией.