Я пытаюсь работать над текстовым классификатором Naive Bayes. Я уже создал набор слов в коде. В своих документах я заметил много особенностей, уникальных для определенных классификаций. Примеры этих функций включают, содержит ли документ местоположение, дату или имя. Все это логические значения, и их можно определить до того, как текст будет классифицирован. Есть и другие функции, такие как первое слово и т. д.
Я понимаю базовый наивный байесовский подход. Но не удалось найти информацию о включении этих функций в классификатор.
Мой вопрос в том, можно ли включить функции, о которых я упоминал выше, с помощью набора слов? Если да, то есть ли пример этого, которому я мог бы следовать. Если это не так, что посоветуете?
Спасибо