Я новичок в Tidy Models, и мне он пока нравится, но у меня есть вопрос об использовании интерфейса без формул для повторной выборки / перекрестной проверки. Как я понимаю до сих пор, чтобы применить resampling () / cross validation, я должен написать
- рецепт с формулой: исход ~ предикторы
rf_rec <-
recipe(y_graduated ~ .,
data = trainDat_predSet)
- указать модель
# Setting Random Forest Model Specifications
rf_model <-
rand_forest() %>%
set_engine("ranger") %>%
set_mode("classification") %>%
set_args(mtry = 3,
trees = 50,
min_n = 5)
- создавать складки
set.seed(1234)
trainDatFolds <-
rsample::vfold_cv(data = trainDat, v = 5)
- включить рецепт и спецификацию модели в рабочий процесс
rf_workflow <-
workflow() %>%
add_recipe(rf_rec) %>%
add_model(rf_model)
- Потом подгоните ресэмплинг.
rf_workflow %>%
fit_resamples(resamples = trainDatFolds,
metrics = metric_set(roc_auc, pr_auc, accuracy),
control = control_resamples(save_pred = TRUE)
)
Для моих целей гораздо удобнее иметь возможность использовать неформульный интерфейс предикторов результата.
Без шага рецепта и если я выполнял повторную выборку подгонки, я мог бы легко использовать функцию - fit_xy (), чтобы указать набор y-результата и x-предиктора.
Это вариант для повторной выборки?
Большое спасибо!