Использование CrateData для индексации и хранения 1 миллиона PDF-файлов

Мы ищем решение, которое позволило бы нам индексировать и хранить миллионы PDF-файлов. В настоящее время мы используем Lucene+Tika, но храним PDF-файлы в файловой системе в виде BLOB-объектов (BLOB-объектов ZODB).

Можно ли использовать Crate.io как для индексации, так и для хранения большого количества (миллионов) PDF-файлов?


person Oliver Marx    schedule 22.10.2014    source источник


Ответы (1)


Да, конечно, это один из сценариев, для которого действительно создан ящик. Возможно, этот недавний запрос/обсуждение функции также будет вам интересен: https://github.com/crate/crate/issues/1206

person Sebastian Utz    schedule 22.10.2014