Получение только выделенного поля solr, а не всего содержимого

Я хотел индексировать pdf, текстовые документы с помощью solr. В ответ на поиск приходит все содержимое документа word/pdf, а также выделенный фрагмент. Контент довольно длинный, и я хотел избежать его в ответе поиска из-за длины контента.

Можно ли получить только выделенный фрагмент поля содержимого?

Вот поисковый запрос

http://localhost:8080/solr4x/collection1/select?q=Scripting&wt=xml&hl=true&hl.fl=content

Вот схема

<field name="content" type="text_general" indexed="false" stored="true"multiValued="true"/>

<field name="text" type="text_general" indexed="true" stored="false" multiValued="true"/>

 <copyField source="content" dest="text"/>

Я использую солер 4.3


person Shad Amez    schedule 14.05.2013    source источник


Ответы (2)


Вы можете указать в URL-адресе вашего запроса, какие поля вы хотите вернуть:

http://localhost:8080/solr4x/collection1/select?q=Scripting&wt=xml&hl=true&hl.fl=content&fl=text

Параметр поля SOLR

Или вы не могли сохранить поле содержимого (хотя и не уверены в полезности поля, которое не хранится и не индексируется):

<field name="content" type="text_general" indexed="false" stored="false" multiValued="true"/>
person nimeshjm    schedule 14.05.2013

Я бы предложил добавить к вашему запросу &hl.fragsize=100 (размер фрагмента). По умолчанию это должно быть 100, но я не уверен, почему он загружает для вас полный контент. Для этого нужно будет посмотреть ваш solrconfig.xml.

Попробуйте изменить поисковый запрос на:

http://localhost:8080/solr4x/collection1/select?q=Scripting&wt=xml&hl=true&hl.fl=content&hl.fragsize=100

Вот документация по fragsize: http://wiki.apache.org/solr/HighlightingParameters#hl.fragsize

person Aujasvi Chitkara    schedule 14.05.2013