Я изучаю, как извлекать ключевые фразы из документа для моей диссертации.
В своем исследовании я использовал машинное обучение наивного байесовского классификатора для создания обучающей модели признаков термина-кандидата. Одной из функций является тег PoS, я думаю, что эта функция важна для указания того, является ли термин ключевой фразой или нет.
Но вводом наивного байесовского (NB) классификатора являются числа, а тегом PoS является строка.
Поэтому я не знаю, как представить функцию тега PoS в виде числа, чтобы она стала входной функцией для классификатора NB.
Пожалуйста, помогите мне дать ваш совет.
Спасибо и с уважением, Хиен Су