Что означает популярность документа в Solr

Что такое популярность документа в solr indexing..?

Парсер EDisMax использует параметр boost. В примере &boost=popularity вот так я заметил один запрос. Я не мог понять, что такое boost, а также boost=popularity. Прежде чем понять параметр повышения, я хотел бы знать, что такое «популярность» в индексировании документов.


person gangatharan    schedule 03.12.2012    source источник


Ответы (2)


popularity — это просто поле, которое использовалось в качестве примера, а boost — это параметр запроса, определенный для обработчика запроса edismax. Повышение означает влияние на оценку (релевантность каждого поискового запроса) в зависимости от значения некоторого поля (или результата некоторой функции на основе значений поля).

См. раздел The boost Parameter в https://cwiki.apache.org/confluence/display/solr/The+Extended+DisMax+Query+Parser.

Если вы хотите реализовать что-то вроде popularity в своем собственном индексе, вам нужно будет:

  1. добавьте в схему поле popularity с типом int, float или ExternalFileField (в зависимости от того, как вы его индексируете и применяете).
  2. собирать статистические данные для ваших результатов поиска и сохранять их в отношении идентификаторов документов (например, путем оценки журналов доступа)
  3. во время индексации или через ExternalFileField (или в будущем через docValues частичные обновления) сохраняйте значения популярности, которые вы получаете из ваших статистических данных.
  4. примените усиление во время запроса, установив параметр boost=popularity (или используя popularity в функциональном запросе).

Подробнее о продвижении популярности:

https://www.slideshare.net/lucenerevolution/potter-timothy-boosting-documents-in-solr

Частичное обновление docValues: https://issues.apache.org/jira/browse/SOLR- 5944

ExternalFileField: http://www.findwise.com/blog/externalfilefield-in-solr/

person Risadinha    schedule 11.07.2016

Повышение используется для повышения оценки определенных документов. Вы можете использовать ускорение времени индексирования или ускорение времени запроса. Для увеличения времени индексирования вы можете установить атрибут boost и значение для документа, который вы индексируете. Для увеличения времени запроса вы можете либо увеличить поле, установив значение повышения, либо использовать предопределенные функциональные запросы.

Для получения дополнительной информации о продвижении см. документы в Solr wiki.

boost=popularity означает, что популярность документов рассчитывается во внешнем поле (используя ExternalFileField) и используется для повышения оценки за счет использования значения популярности. Популярность документов можно рассчитать с помощью количества просмотров или любых других параметров, которые вы хотите. Чтобы узнать больше о повышении популярности документов, вы можете проверьте этот документ.

person Parvin Gasimzade    schedule 03.12.2012
comment
очень расплывчато, boost=popularity не было объяснено, как вы устанавливаете популярность документа в Solr. - person user1965449; 06.12.2014