Маллет: получить значение достоверности в алгоритме Maxent

Я использую алгоритм maxent в mallet для классификации меток. Мне было интересно, можно ли получить какое-то значение достоверности для метки, предсказанной классификатором maxent. Что мне в основном нужно, так это лучшие прогнозы K (не для каждого токена, а для всех данных), в которых классификатор наиболее уверен, и использовать их для начальной загрузки. Есть какой-либо способ сделать это ?


person Rahul    schedule 05.07.2011    source источник


Ответы (1)


Посмотрите на объект Labeling, возвращаемый при вызове любого метода классификации молотка. Этот класс содержит все вычисленные оценки для каждой метки: лучший из них становится ответом (это тот, который возвращается методом getBestLabel()). Загвоздка в том, что эти оценки обычно не являются вероятностями. Я не знаком с классификатором maxent от mallet - вам нужно будет посмотреть на код и определить, можно ли каким-то образом "привести" возвращаемые оценки к вероятностям или, возможно, они уже находятся в надлежащей форме. Во всяком случае, похоже, что вы хотите придать смысл относительной разнице между лучшими показателями K. Опять же, это зависит от точных деталей классификатора maxent. Поэтому посмотрите на экземпляры объекта Labeling, фактически возвращенные в вашем наборе данных, и используйте свое лучшее суждение.

Надеюсь это поможет!

person Randall McRee    schedule 07.07.2011