Построение модели логистической регрессии в Python включает несколько шагов: от импорта необходимых библиотек до обучения и оценки модели. Вот простой пример использования популярной библиотеки scikit-learn:
**************
импортировать pandas как pd
из sklearn.model_selection; импортировать train_test_split
из sklearn.preprocessing; импортировать StandardScaler
из sklearn.linear_model; импортировать LogisticRegression
из sklearn.metrics;
# Загрузите свой набор данных
data = pd.read_csv('your_dataset.csv') # Замените своим набором данных
# Разделить данные на функции (X) и метки (y)
X = data.drop(‘target_column’, axis=1)
y = data[‘target_column’]
# Разделить данные на наборы для обучения и тестирования
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0,2, random_state=42)
# Стандартизация функций
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)
# Построить и обучить модель логистической регрессии
model = LogisticRegression()
model.fit(X_train_scaled, y_train)
# Прогнозирование набора тестов
y_pred = model.predict(X_test_scaled)
# Оценка модели
print(confusion_matrix(y_test, y_pred))
print(classification_report(y_test, y_pred))
****************
В этом примере:
- Замените
'your_dataset.csv'
фактическим путем к вашему файлу набора данных. - Замените
'target_column'
именем столбца, содержащего вашу целевую переменную (ту, которую вы пытаетесь предсказать). - Убедитесь, что в вашем наборе данных есть функции (переменные-предикторы) и целевой столбец.
- Функция
train_test_split
разбивает данные на наборы для обучения и тестирования.