Индексирование PDF - Фасетный поиск с помощью Apache Solr и Apache Tika

Две недели назад у меня возникли проблемы с поиском в Интернете решения. Мне нужно интегрировать веб-приложение с Apache Solr и Apache tika, чтобы сделать PDF-файлы с фасетным поиском, которые находятся в базе данных системы. С конфигурацией solr и tika на моем сервере все в порядке, но, поскольку я новичок в этих двух инструментах, я не уверен, как интегрировать друг друга, а также с приложением.


person Bruno Henrique Gaignoux Gomes    schedule 25.10.2016    source источник


Ответы (1)


Solr 6.2 поставляется с files example в example / files, который настроен специально для индексации и просмотра файлов с расширенным содержимым (например, PDF).

Начните с этого и попытайтесь понять, как это устроено.

person Alexandre Rafalovitch    schedule 28.10.2016