Я получаю исключение при попытке использовать обновление/извлечение файлов PDF
Моя настройка: Ubuntu Server 11.10 Tomcat 6 Solr 3.5.0.2011.11.22.15.54.38
Я могу перейти к solr/admin OK
Я поместил все библиотеки contrib/extract и apache-solr-cell3.5.0.jar в папку tomcat webapps/solr/WEB-INF/lib
Я вызываю извлечение, используя: -
curl "http://localhost:8080/solr/update/extract?uprefix=attr_&fmap.content=attr_content&commit=true" -F "file=/path/to/my.pdf"
ошибка
java.lang.NoClassDefFoundError: org/apache/tika/mime/MimeTypeException
at java.lang.Class.forName0(Native Method)
at java.lang.Class.forName(Class.java:264)
at org.apache.solr.core.SolrResourceLoader.findClass(SolrResourceLoader.java:383)
at org.apache.solr.core.SolrCore.createInstance(SolrCore.java:425)
at org.apache.solr.core.SolrCore.createRequestHandler(SolrCore.java:461)
at org.apache.solr.core.RequestHandlers$LazyRequestHandlerWrapper.getWrappedHandler(RequestHandlers.java:248)
at org.apache.solr.core.RequestHandlers$LazyRequestHandlerWrapper.handleRequest(RequestHandlers.java:239)
at org.apache.solr.core.SolrCore.execute(SolrCore.java:1372)
Буду признателен за любые указатели - единственный раз, когда эта ошибка появляется в другом месте, - это Nutch и кешированные результаты.
Я попытался отправить mimetype в строке запроса, а также файл *.doc, но получил ту же ошибку.