NoClassDefFoundError MimeTypeException с извлечением PDF

Я получаю исключение при попытке использовать обновление/извлечение файлов PDF

Моя настройка: Ubuntu Server 11.10 Tomcat 6 Solr 3.5.0.2011.11.22.15.54.38

Я могу перейти к solr/admin OK

Я поместил все библиотеки contrib/extract и apache-solr-cell3.5.0.jar в папку tomcat webapps/solr/WEB-INF/lib

Я вызываю извлечение, используя: -

curl "http://localhost:8080/solr/update/extract?uprefix=attr_&fmap.content=attr_content&commit=true" -F "file=/path/to/my.pdf"

ошибка

java.lang.NoClassDefFoundError: org/apache/tika/mime/MimeTypeException
at java.lang.Class.forName0(Native Method)
at java.lang.Class.forName(Class.java:264)
at org.apache.solr.core.SolrResourceLoader.findClass(SolrResourceLoader.java:383)
at org.apache.solr.core.SolrCore.createInstance(SolrCore.java:425)
at org.apache.solr.core.SolrCore.createRequestHandler(SolrCore.java:461)
at org.apache.solr.core.RequestHandlers$LazyRequestHandlerWrapper.getWrappedHandler(RequestHandlers.java:248)
at org.apache.solr.core.RequestHandlers$LazyRequestHandlerWrapper.handleRequest(RequestHandlers.java:239)
at org.apache.solr.core.SolrCore.execute(SolrCore.java:1372)

Буду признателен за любые указатели - единственный раз, когда эта ошибка появляется в другом месте, - это Nutch и кешированные результаты.

Я попытался отправить mimetype в строке запроса, а также файл *.doc, но получил ту же ошибку.


person paulusm    schedule 09.12.2011    source источник


Ответы (3)


Согласно сообщению об ошибке, это не исключение MimeTypeException, которое вы получаете: Проблема заключается в NoClassDefFoundError, потому что Solr не может загрузить класс MimeTypeException.

Обычно этот класс присутствует в tika-core.jar.

Убедитесь, что у вас действительно есть этот файл, а также проверьте, есть ли у вас оператор lib в вашем solrconfig.xml, указывающий на правильный каталог.

person Daniel Rikowski    schedule 09.12.2011

Это было связано с основной ошибкой копирования необходимых tika-библиотек (в tomcat6/webapps/solr/WEB-INF/lib), но с сохранением права собственности на файлы jar в качестве ROOT вместо того, чтобы передать их TOMCAT6. После установки правильного разрешения и перезапуска Tomcat он начал работать нормально.

person paulusm    schedule 15.12.2011

Нашел решение этой проблемы, я использовал SolrJ для обновления индексации pdf.

после развертывания solr на tomcat я не включил следующие библиотеки в tomcat/webapp

и я получаю все проблемы с ленивой загрузкой и т. д. и т. д. Я даже пытаюсь получить apache tika ... пока не сделаю это ...

выключение кота

\apache-solr-3.5.0\вклад\извлечение

скопируйте библиотеки выше и ниже

\apache-tomcat-7.0.26\webapps\solr\WEB-INF\lib

запуск кота

ваше здоровье

person raymond    schedule 01.04.2012