Использование CrateData для индексации и хранения 1 миллиона PDF-файлов

Мы ищем решение, которое позволило бы нам индексировать и хранить миллионы PDF-файлов. В настоящее время мы используем Lucene+Tika, но храним PDF-файлы в файловой системе в виде BLOB-объектов (BLOB-объектов ZODB).

Можно ли использовать Crate.io как для индексации, так и для хранения большого количества (миллионов) PDF-файлов?

lucene crate apache-tika

Oliver Marx 22.10.2014 источник

Ответы (1)

arrow_upward
2
arrow_downward

Да, конечно, это один из сценариев, для которого действительно создан ящик. Возможно, этот недавний запрос/обсуждение функции также будет вам интересен: https://github.com/crate/crate/issues/1206

Sebastian Utz 22.10.2014

Использование CrateData для индексации и хранения 1 миллиона PDF-файлов

Ответы (1)

Вопросы по теме