10-кратная перекрестная проверка в Weka

Меня немного смущает разница между 10-кратной перекрестной проверкой, доступной в Weka, и традиционной 10-кратной перекрестной проверкой. Я понимаю концепцию K-кратной перекрестной проверки, но из того, что я прочитал, 10-кратная перекрестная проверка - проверка в Weka немного отличается.

В Weka FIRST модель строится на ВСЕХ данных. Только после этого выполняется 10-кратная перекрестная проверка. При традиционной 10-кратной перекрестной проверке модель не строится заранее, строится 10 моделей: по одной на каждой итерации (пожалуйста, поправьте меня, если я ошибаюсь!). Но если это так, что, черт возьми, делает Weka во время 10-кратной перекрестной проверки? Создает ли он снова модель для каждой из десяти итераций или использует ранее собранную модель. Спасибо!


person JohnDoe    schedule 14.08.2013    source источник


Ответы (1)


Насколько мне известно, перекрестная проверка в Weka (и других методах оценки) используется только для оценки ошибки обобщения. То есть (неявное) предположение состоит в том, что вы хотите использовать изученную модель с данными, которые вы не передали Weka (также называемые «набором проверки»). Следовательно, полученная модель обучается на всех данных.

Во время перекрестной проверки он обучает и оценивает ряд различных моделей (10 в вашем случае), чтобы оценить, насколько хорошо изученная модель обобщает. На самом деле вы не видите этих моделей - они используются только для внутреннего пользования. Показанная модель не оценивается.

person Lars Kotthoff    schedule 14.08.2013
comment
Спасибо, это ответ на мой вопрос! - person JohnDoe; 14.08.2013
comment
На самом деле вы не видите этих моделей - они используются только для внутреннего использования - вы можете увидеть эти модели в Weka Explorer. На вкладке «Классификация» в разделе «Дополнительные параметры ...» выберите «Выходные модели для обучающих разделений». - person Flux; 17.07.2021