Смоделируйте и оцените вероятность события в зависимости от других независимых переменных.

Линейная регрессия часто подвержена ошибкам, вызванным искаженным вводом данных (выбросы), которые резко меняют модель линейной регрессии.

Большинство примеров из реального мира носят нелинейный характер, в большинстве задач бинарной классификации лучше всего подходит логистическая регрессия, например. на основе кредитного рейтинга, если кто-то собирается получить одобрение кредита или нет.

Коэффициенты регрессии для логистической регрессии рассчитываются с использованием оценки максимального правдоподобия (MLE).

Общие шаги моделирования

Получите наборы обучающих и тестовых данных
из sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0,33, random_state = 0)

Измените масштаб данных
из sklearn.preprocessing import StandardScaler
sc_X = StandardScaler()
X_train = sc_X.fit_transform(X_train)
X_test = sc_X.transform (X_тест)

Построить модель регрессии
из sklearn.linear_model import LogisticRegression
classifier = LogisticRegression(random_state=0)
classifier.fit(x_train, y_train)

Создайте набор прогнозов
y_pred = classifier.predict(x_test)

проверьте точность, используя матрицу неточностей
из sklearn.metrics; у_тест, у_пред)