У меня есть несколько миллионов документов в моем индексе. У меня есть предложение, и я хочу получить документ, который соответствует как можно большему количеству слов. Мне нужно искать только одно поле content
curl -X GET "xxx.com:9200/test/_search?pretty" -H 'Content-Type: application/json' -d'
{
"query" : {
"bool" : { "must" : [{"term": {"content": {"value": "popular artworks of Banksy"}}}]
}}
}
'
Я хочу, чтобы документ содержал столько же слов из запроса и больше, тем лучше. Если есть документ с текстом, в котором много вхождений художественного произведения, Бэнкси и несколько популярных - он должен получить высокую оценку. Кроме того, можно ли придать меньшее значение совпадению со словом, которое встречается чаще, чем другие? Как больше веса для популярного, чем Бэнкси. Я понимаю, что мог бы использовать boost. Но я не хочу устанавливать эти значения вручную. Я хочу, чтобы у него было неявное понимание, если это возможно.