Как получить форму множественного числа из формы единственного числа?

Я хочу получить множественное число от данного существительного. Я пробовал JAVA INFLECTOR. Но он имеет очень низкую точность для существительных, не соответствующих обычным правилам.

Примеры из JAVA INFLECTOR:

  1. папараццо -> папарацци
  2. критерий -> критерии
  3. зуб -> зубья
  4. вор -> воры
  5. буханка -> буханки

Лемматизатор Stanford coreNLP очень хорош в преобразовании множественного числа в единственное. Он заботится о многих исключительных случаях. Как указано ниже:

Множественное число в единственное число от STANFORD LEMMATIZER:

  1. вершины -> вершины
  2. спектры -> спектр
  3. выпускники -> выпускники
  4. критерии -> критерий
  5. воры -> вор
  6. гуси -> гусь
  7. грибы -> грибок
  8. буханки -> буханка.

Но проблема в том, что я не знаю, как получить множественное число от данного единственного числа с помощью Stanford CoreNLP. Лемматизатор дает единственное число от множественного числа.

Итак, в основном я хочу получить множественное число от существительных в единственном числе, используя STANFORD NLP.

Как этого добиться?


person k2516    schedule 23.03.2014    source источник
comment
Напоминает мне самое первое, что я пытался запрограммировать с другом. К сожалению, у меня нет опыта в Стэнфордском НЛП, но я хотел бы получить ответ на этот вопрос. Ваш первый набор примеров является результатом работы Java Inflector? Зуб - ›Зубы, ты можешь понять, почему тебе это не нравится. Критерий - единственно правильный.   -  person Erwin Bolwidt    schedule 23.03.2014
comment
@ErwinBolwidt да, это вывод java-инфлектора. И второй набор примеров взят из stanford corenlp lemmatizer. Я его только что отредактировал.   -  person k2516    schedule 23.03.2014
comment
@ErwinBolwidt на самом деле критерием является моя опечатка. LOL. Он дал критерии- ›критерии. Я это тоже редактировал.   -  person k2516    schedule 23.03.2014


Ответы (1)


Если вы можете использовать javascript, я создал для этого облегченный javascript. Очень просто использовать:

pluralizer.run('goose') --> 'geese'
pluralizer.run('deer') --> 'deer'
pluralizer.run('can') --> 'cans'

https://github.com/rhroyston/pluralizer-js

person Ronnie Royston    schedule 05.09.2017