Совершенно новичок в python и машинном обучении.
Я пытаюсь построить модель логистической регрессии. Я работал в R, чтобы получить лямбда, и использовал перекрестную проверку, чтобы найти лучшую модель, и теперь переношу ее в python.
Здесь я создал матрицу дизайна и сделал ее разреженной. Затем запустили логистическую регрессию. Кажется, это работает.
Мой вопрос в том, что, поскольку я заявил, что мой термин item_number является категорией, как мне узнать, какая из них стала фиктивной переменной? И как узнать, какой коэффициент соответствует названию каждой категории?
from patsy import dmatrices
from sklearn.linear_model import LogisticRegression
from sklearn import preprocessing
def train_model (data, frm, Rlambda):
y, X = dmatrices(frm , data, return_type="matrix")
y = np.ravel(y)
scaler = sklearn.preprocessing.MaxAbsScaler(copy=False)
X_trans = scaler.fit_transform(X)
model = LogisticRegression(penalty ='l2', C=1/Rlambda)
model = model.fit(X_trans, y)
frm = 'purchase ~ price + C(item_number)'
Rlambda = 0.01
model, train_score = train_model(data1,frm,Rlambda)