Расположение файла, содержащего искомое слово (Solr с ExtractingRequestHandler)

Я только запускаю Solr и использую ExtractingRequestHandler для индексации файлов PDF с помощью команды curl:

curl "http://localhost:8983/solr/update/extract?literal.id=doc1&commit=true" -F "[email protected]"

Я использовал Solarium в качестве клиента Solr для запроса и вывода результатов.
Но все эти шаги по-прежнему бесполезны, пока пользователь не может знать, из какого файла взято слово, которое он ищет.
Поэтому я просто хочу показать часть текста, где находится ключевое слово. в файле, а также ссылку на файл для его загрузки, например.
Любая помощь будет принята с благодарностью.


person Nadjib Mami    schedule 09.10.2012    source источник
comment
Что ж, одно из найденных решений — передать имя файла литеральному атрибуту. У меня есть сотни файлов. Мне нужно перебрать все файлы, и для каждой итерации я получаю имя файла и передаю его команде curl. Я думаю, что я должен сделать это в файле bash, любой может мне помочь, так как я еще ничего об этом не знаю.   -  person Nadjib Mami    schedule 09.10.2012
comment
да, вам нужно будет повторить и загрузить файлы как отдельные документы. Затем их можно выделить.   -  person Jayendra    schedule 09.10.2012


Ответы (1)


Вам нужно будет проверить подсветку solr, что позволит вам выделить совпадения с частью текст вокруг него.

person Jayendra    schedule 09.10.2012
comment
Великий Джайендра, Спасибо. Что с расположением файла? Проверьте мой последний комментарий. - person Nadjib Mami; 09.10.2012
comment
Служба подсветки от Solarium находится здесь: wiki.solarium-project.org/index. php/V2:Highlighting_component - person Nadjib Mami; 09.10.2012