Включить синонимы в solr

я использую solr для своих поисков. в этом я нашел файл synonyms.text, в котором вы можете вручную включать синонимы для слов, которые вы хотите.

Но, как я полагаю, было бы очень сложно вручную включать синонимы для каждого слова, так как мое приложение имеет большие данные.

Я хочу знать, есть ли способ, которым этот файл synonym.text генерируется автоматически, ссылаясь на все слова словаря.


person Romi    schedule 28.06.2011    source источник


Ответы (1)


Имхо нельзя. Вам нужно хотя бы семантическое отношение между двумя словами, то есть токенами. ЕСЛИ у вас есть что-то вроде базы данных, включая семантические отношения синонимов, вы, конечно, можете сгенерировать эти данные.

Одним из примеров может быть wiktonary (XML-дамп: Ссылка). Но могут быть доступны и другие примеры словарей, но я думаю, что вы не получите такой исчерпывающий источник, как вам хотелось бы. Анализ XML-дампа Wiktonary, возможно, является вашим лучшим выбором, и вы даже можете выровнять синонимы на разных языках, если у вас есть многоязычный индекс.

person fyr    schedule 28.06.2011