Наконец-то я добрался до этой истории, которую хотел рассказать, но каждый раз откладывал из-за объема информации. Теперь пришло время погрузиться в классификацию (частично). Если этот пост будет успешным, я продолжу его развивать.

Представим себе следующее: у нас есть комната зеленых (положительных) и красных (отрицательных) точек, и нам нужно разделить их, начертив плоскость, определяемую вектором β.

Это линейные модели (lm), и вот их основные типы:

1. Логистическая регрессия

Он определяет вероятность класса y с данными x как p(y|x) = 1/(1+eβx).

Он использует логистическую функцию для преобразования расстояния от плоскости к вероятностям. Логистическая регрессия пытается найти такую ​​плоскость, в которой все точки одного класса находятся как можно дальше от границы в правильном направлении.

Как правило, он максимизирует произведение вероятностей, которое модель выделяет правильному классу. Такой результат называется вероятностью.

Процесс поиска оптимальной границы решения путем оптимизации правдоподобия называется оценкой максимального правдоподобия.

2. Машина опорных (линейных) векторов (SVM)

SVM — еще одна распространенная линейная модель, которая оптимизируется по немного другим критериям. Он максимизирует расстояния между плоскостью и ближайшими точками с некоторым штрафом за точки, лежащие не на той стороне.

3. Наивный байесовский классификатор

Его логика отличается от двух, которые мы рассмотрели ранее. Мы хотим предсказать вероятность класса c с учетом некоторых атрибутов x= (x1,x2,… ,xn), то есть P(c|x). Применяя правило Байеса дважды, мы обнаруживаем, что P (c|x) ∼P( c) ∏iP(c|xi), если мы наивно предполагаем, что атрибуты независимы.

Мы видим, что модель также может быть отражена уравнением того же вида, что и линейная регрессия после некоторых манипуляций. Единственная разница в том, как плоскость соответствует данным.

Спасибо, что прочитали! Если вы хотите поделиться со мной своим мнением или идеями, вы можете свободно писать в разделе комментариев. Не стесняйтесь обращаться ко мне в Профиль LinkedIn для любых предложений или разъяснений.

Хорошего дня!