Как выполнить стемминг/лемминг в поисковом приложении GAE?

Я пытаюсь внедрить основу в своем поисковом приложении. Я уже пробовал использовать оператор ~, но это не сработало.

Итак, у меня 3 вопроса:

1) Должен ли я каким-то особым образом индексировать документ, чтобы иметь возможность искать его с помощью оператора ~? У меня есть документ, содержащий "слова", но его нельзя найти с помощью query="~word".

2) Поддерживает ли оператор ~ другие языки?

3) Не могли бы вы предложить использовать другой стеммер/леммер, но не встроенный?

Большое спасибо!


person typedef    schedule 21.05.2013    source источник


Ответы (1)


Оператор основы ~ работает, по крайней мере, для поиска слова «слова» с запросом ~слово.

Вы ставите «~ слово» в кавычки в запросе? Это отключит стемпинг.

Кроме того, я забыл упомянуть ранее, что в настоящее время на серверах разработки не реализовано выделение корней; он работает только в реальной среде App Engine, размещенной в Google.

person Alan    schedule 24.06.2013