Я пытаюсь применить логистическую регрессию в Python с помощью statsmodel.api.Logit. Я столкнулся с ошибкой ValueError: массив не должен содержать inf или NaN.
Когда я выполняю:
data['intercept'] = 1.0
train_cols = data.columns[1:]
logit = sm.Logit(data['admit'], data[train_cols])
result = logit.fit(start_params=None, method='bfgs', maxiter=20, full_output=1, disp=1, callback=None)
Данные содержат более 15000 столбцов и 2000 строк. which data ['admit'] - это целевое значение, а data [train_cols] - это список функций. Кто-нибудь может дать мне несколько советов, как решить эту проблему?