Как использовать параметры атрибутов функций классификаторов RWeka?

В классификаторах RWeka в вызове функции классификатора есть атрибут «options», например, Bagging(formula, data, subset, na.action, control = Weka_control(), options = NULL< /сильный>). Может ли кто-нибудь привести пример (пример кода R) о том, как определить эти параметры?

Мне было бы интересно передать некоторые параметры (такие как количество итераций и размер каждого мешка) метаобучающемуся в пакетировании RWeka. Заранее спасибо!


person Alex    schedule 27.03.2018    source источник


Ответы (1)


Вы можете получить доступ к функциям, которые вы упомянули, но не через options.

Во-первых, что делают опции ? Согласно странице справки ?Bagging

Параметры аргумента допускают дальнейшую настройку. В настоящее время используются параметры модели и экземпляры (или их частичное совпадение): если установлено значение TRUE, кадр модели или соответствующие экземпляры Weka, соответственно, включаются в подогнанный объект модели, что, возможно, ускоряет последующие вычисления на объекте. По умолчанию ни один из них не включен.

Таким образом, options просто хранит больше информации в возвращаемом результате. Чтобы получить нужные вам функции, вам нужно использовать control. Вам нужно будет построить значение для control с помощью функции Weka_control. Без некоторой помощи трудно понять, как это использовать, но, к счастью, помощь доступна через WOW мастер опций Weka. Поскольку вариантов много, вывод длинный. Я собираюсь урезать его только до той части, которая касается функций, которые вы упомянули, — количества итераций и размера каждой сумки. Но посмотрите, что еще есть в наличии.

WOW(Bagging)
-P      Size of each bag, as a percentage of the training set size. (default 100)
-I <num>
        Number of iterations.  (current value 10)
        Number of arguments: 1.

Повторяю: я обрезал вывод, чтобы показать только эти два параметра.

Пример: данные диафрагмы

Предположим, что я хочу использовать пакетирование с данными радужной оболочки с размером пакета, равным 90% данных (вместо 100% по умолчанию) и с 20 итерациями (вместо 10 по умолчанию). Сначала я бы создал Weka_control, а затем включил его в свой вызов Bagging.

WC = Weka_control(P=90, I=20) 
BagOfIrises = Bagging(Species ~ ., data=iris, control=WC)

Я надеюсь, что это помогает.

person G5W    schedule 28.03.2018
comment
Спасибо. Протестировано с количеством итераций и, кажется, работает. - person Alex; 29.03.2018