В предыдущей статье вы разобрались с математикой и интуицией, лежащими в основе линейной регрессии, фундаментального алгоритма, используемого для бесконечного прогнозирования значений. Короче говоря, вы пытаетесь подогнать линию к заданному набору точек, минимизируя функцию стоимости. Теперь давайте попробуем понять интуицию, лежащую в основе другого фундаментального, но важного алгоритма под названием «Логистическая регрессия». В этой статье мы подчеркнем сходство между линейной и логистической регрессией. Как только вы освоитесь с идеей управления этим алгоритмом, мы сможем разобраться в математике, лежащей в основе этого.

Когда применять логистическую регрессию?

Говоря языком новичков, мы применяем этот алгоритм для решения набора проблем, называемых проблемами классификации с двоичной зависимой переменной. Давайте разберем термины, чтобы вы могли ясно их понять. Переменная называется независимой, если на принимаемые ею значения не могут повлиять никакие другие параметры. Зависимая переменная - как раз наоборот. На значения, которые может принимать зависимая переменная, влияют многочисленные переменные. Если вы читали Соединение точек с линейной регрессией, вы бы заметили, что все независимые переменные были представлены с помощью переменной x, а зависимые - с помощью г. Здесь двоичная зависимая переменная - это зависимая переменная, которая может принимать два разных дискретных значения, обычно, но не всегда, 0 и 1, то есть отрицательные и положительные значения. Мы будем следовать одним и тем же соглашениям на протяжении всей статьи и в следующих. Возвращаясь к проблеме классификации, все дело в математическом вычислении всех возможных дискретных значений зависимой переменной с использованием заданного набора независимых переменных. Хотя небинарные дискретные зависимые переменные также возможны, мы ограничимся двоичными переменными на время.

Почему слово «регрессия»?

Среди любителей машинного обучения существует неправильное понимание того, что регрессия означает прогнозирование непрерывных значений и классификацию дискретных наборов значений. Но фактическое значение этого термина - «изучить взаимосвязь между набором независимых переменных и зависимой переменной», что совершенно логично. Более того, когда мы рассмотрим аналитическую часть в следующих статьях, вы увидите, что подход, который мы используем как для линейной регрессии, так и для логистической регрессии, очень похож и работает по одному и тому же принципу минимизации функции затрат.

Приложение

Вот некоторые из типичных и классических проблем, которые решаются с помощью логистической регрессии:

  1. Классификация опухолей.
  2. Классификация животных.
  3. Обнаружение и классификация рукописных цифр.

Если вы наткнетесь на какое-либо другое приложение, упомяните его в комментариях.

Вот и все на этой неделе. В следующем мы подробно рассмотрим математику, лежащую в основе алгоритма, его плюсы и минусы. Мы также постараемся показать вам пример, если это возможно.
Оставайтесь с нами!

Подключиться • Учиться • Расти