Загрузка большого файла RDF в Sesame

Я пытаюсь создать конечную точку SPARQL на основе Sesame. Я установил Tomcat, PostgreSQL и развернул веб-приложение Sesame. Я создал репозиторий на основе хранилища PostgreSQL RDF. Теперь мне нужно загрузить большой ttl-файл (540M троек, размер файла несколько ГБ) в репозиторий. Загружать большой файл через Workbench — не лучшее решение — это займет несколько дней. Какое лучшее непрограммирующее решение для загрузки данных? Существуют ли такие инструменты, как «консоль» для загрузки данных? Например, у Virtuoso есть инструмент isql для массовой загрузки...


person Dilshod    schedule 26.11.2014    source источник
comment
Имейте в виду, что серверная часть Sesame PostgreSQL устарела и больше не поддерживается.   -  person Jeen Broekstra    schedule 26.11.2014


Ответы (1)


Насколько мне известно, для Sesame нет готового инструмента для массовой загрузки, хотя поставщики тройных магазинов, совместимых с Sesame, имеют такой инструмент как часть своей конкретной базы данных. Программирование решения для массовой загрузки не особенно сложно, но мы почему-то так и не удосужились включить такой инструмент в базовый дистрибутив Sesame.

Между прочим, 540M троек, вероятно, слишком много для любого из хранилищ Sesame по умолчанию — Native Store масштабируется только примерно до 150M, а загрузка такого большого набора данных в хранилище памяти слишком громоздка (даже если у вас есть доступная оперативная память). . Поэтому вам, вероятно, следует изучить возможность использования совместимой с Sesame базы данных, предоставленной третьей стороной. Доступно множество вариантов, как коммерческих, так и бесплатных/с открытым исходным кодом, см. этот обзор на веб-сайте Sesame для списка некоторых предложений.

person Jeen Broekstra    schedule 26.11.2014
comment
По указанной ссылке 404. - person Ortomala Lokni; 23.05.2016
comment
С переходом на Eclipse RDF4J сайт был реорганизован. Обновленная ссылка находится здесь: rdf4j.org/about/rdf4j-databases - person Jeen Broekstra; 24.05.2016