RavenDB: Грамматический и фонетический анализ?

Меня немного смущает уровень интеграции между Lucene.NET и RavenDB. Lucene поддерживает грамматический и фонетический анализ текстов (например, определение корней слов, метафон), чтобы обеспечить поиск, соответствующий документу на основе сходства. Сейчас Lucene используется для запроса индексов, а из того, что я беру из документации, еще и для их построения (см. http://ravendb.net/documentation/docs-http-indexes-querying, последний раздел).

Однако анализаторы Lucene, обеспечивающие грамматический и фонетический анализ, похоже, не работают. Или они есть, и я пропускаю переключатель? Или есть ли способ установить/создать плагин для добавления текстовых анализаторов в RavenDB?

nosql ravendb lucene.net

GreenIcicle 07.07.2010 источник

Ответы (1)

arrow_upward
3
arrow_downward

На данный момент невозможно настроить анализатор, см. эту тему для более подробного обсуждения.

Если вы внесете свой вклад в обсуждение здесь, оно может быть добавлено. Вы не первый человек, который просил такое поведение.

Одним из возможных решений является предварительная токенизация или анализ теста самостоятельно. Итак, в индекс добавляется измененный текст. Например, вы можете изменить «run» на «run run runner» и т. д. Тогда поиск «runs» найдет ваш документ. Существует также нечеткий поиск, который может помочь, см. здесь для получения дополнительной информации. Информация

Обновить эта функция теперь добавлена в RavenDB, см. здесь для более подробной информации

Matt Warren 07.07.2010

RavenDB: Грамматический и фонетический анализ?

Ответы (1)

Вопросы по теме