Идиома Pandas для прикрепления столбца прогнозов к кадру данных

Что такое идиома Pandas для привязки результатов прогноза к кадру данных, на котором был сделан прогноз.

Например, если у меня есть что-то вроде (где qualityTrain является результатом stats models fit)

qualityTrain = quality_data[some_selection_criterion]
pred1 = QualityLog.predict(qualityTrain)
qualityTrain = pd.concat([qualityTrain, pd.DataFrame(pred1, columns=['Pred1'])], axis=1)

значения «Pred1» неправильно выровнены с остальными qualityTrain. Если я изменю последнюю строку так, чтобы она читалась

...pd.DataFrame(pred1, columns=['Pred1'], index=qualityTrain.index)...

Я получаю ожидаемые результаты.

Есть ли лучшая идиома для прикрепления результатов к фрейму данных, где фрейм данных может иметь произвольный индекс?


person orome    schedule 19.03.2014    source источник


Ответы (1)


Вы можете просто сделать

qualityTrain['Pred1'] = pred1

Обратите внимание, что мы (statsmodels) собираемся иметь pandas-in, pandas-out для предсказания довольно скоро, поэтому мы надеемся, что это облегчит некоторые из этих болевых точек.

person jseabold    schedule 19.03.2014