Алгоритм сортировки строк в FAST ESP

Кто-нибудь знает о логике сортировки в движке FAST ESP ver. 5,3? Как обрабатываются специальные символы и как выполняется сортировка японских и китайских слов?

Вот первые 8 результатов поиска, отсортированные в порядке возрастания:

門
¿ c
¿ c¡a «n »c ‹e ›r § ¶~#15
¿ c¡a «n »c ‹e ›r § ¶~#44
¿ c¡a «n »c ‹e ›r § ¶~#45
§ word document4
門 他の他の
門 他の他の 2

Означает ли это, что символ исключен из области сортировки?

И это топ-10 результатов поиска, отсортированных в порядке убывания:

他の門そ他の門
の他
他の
そ他の門そ他の
そ他の門門門
そ他他そ
そ
そ他
СЌРЅРІР»гЃќд»
марцпиорыв

Похоже, что последние два результата с кириллическими символами обрабатываются правильно, но затем наблюдается неоднозначность, когда результат помещается между そ他 и そ他他そ.


person AlexProutorov    schedule 19.08.2014    source источник


Ответы (1)


Сортировка выполняется в алфавитном порядке для латинских и греческих языков, но в случае с языками JKC вам необходимо правильно настроить конфигурацию документа, чтобы иметь возможность обрабатывать эти языки. Также вам необходимо установить токенизацию для этих языков. Microsoft предоставляет исправления, включающие токенизацию и словарь для каждого из этих языков. Я думаю, что было бы очень полезно проверить правильность настройки поисковой системы и документов в коллекции.

person Saul Rosales    schedule 31.10.2017