RavenDB: Грамматический и фонетический анализ?

Меня немного смущает уровень интеграции между Lucene.NET и RavenDB. Lucene поддерживает грамматический и фонетический анализ текстов (например, определение корней слов, метафон), чтобы обеспечить поиск, соответствующий документу на основе сходства. Сейчас Lucene используется для запроса индексов, а из того, что я беру из документации, еще и для их построения (см. http://ravendb.net/documentation/docs-http-indexes-querying, последний раздел).

Однако анализаторы Lucene, обеспечивающие грамматический и фонетический анализ, похоже, не работают. Или они есть, и я пропускаю переключатель? Или есть ли способ установить/создать плагин для добавления текстовых анализаторов в RavenDB?


person GreenIcicle    schedule 07.07.2010    source источник


Ответы (1)


На данный момент невозможно настроить анализатор, см. эту тему для более подробного обсуждения.

Если вы внесете свой вклад в обсуждение здесь, оно может быть добавлено. Вы не первый человек, который просил такое поведение.

Одним из возможных решений является предварительная токенизация или анализ теста самостоятельно. Итак, в индекс добавляется измененный текст. Например, вы можете изменить «run» на «run run runner» и т. д. Тогда поиск «runs» найдет ваш документ. Существует также нечеткий поиск, который может помочь, см. здесь для получения дополнительной информации. Информация

Обновить эта функция теперь добавлена ​​в RavenDB, см. здесь для более подробной информации

person Matt Warren    schedule 07.07.2010