Я использовал nutch 1.4 для обхода веб-сайтов и проиндексировал данные в solr 3.5. это было успешно. Я использовал Luke для проверки данных индекса и обнаружил, что было получено 1678 документов. но когда я ввел строку запроса (всего несколько ключевых слов) в интерфейсе solr для поиска, были получены все 1678 документов. это странно, так как большинство извлекаемых веб-страниц вообще не содержали этих ключевых слов.
Любая идея для этой проблемы?
Спасибо.
гром