Подходит ли Drools для написания правил для Stemming и/или POS-тегов? Приветствуются предложения по улучшению языка правил. Я прочитал много статей в этой области, в которых используется подход, основанный на правилах, но ни в одной из них не упоминалось, какая библиотека или фреймворк использовались для написания правил.
Мои правила примерно такие:
if (length = 3 & first_letter in group1 and second_letter in group2) then ...
if (length = 3 & first_letter in group1 and second_letter not_in group2) then ...
if (length = 3 & first_letter not_in group1 and second_letter in group2) then ...
if (length = 3 & first_letter not_in group1 and second_letter not_in group2) then ...
if (length = 4...
... и так далее.
Проблема в том, что этих правил слишком много, чтобы с ними справиться. Представьте, что имеется десять групп букв и что для каждой буквы, принадлежащей каждой группе, есть свой случай. Я мог бы легко иметь более тысячи правил для правильной классификации слова. Я написал 30 из этих правил в простом коде C#, и этого было достаточно, чтобы понять, насколько неэффективен такой подход. Мои правила уже организованы в виде дерева на бумаге. Мне просто нужна правильная структура, чтобы вставлять, представлять, настраивать и тестировать их.
Надеюсь, мой вопрос понятен. Спасибо.