Как загрузить триплеты из csv-файла в MarkLogic?

Я начну с таблицы почтовых индексов из Нидерландов. Я разделил его на пару CSV-файлов, содержащих, например, город в качестве субъекта, PartOf в качестве предиката и муниципалитет в качестве объекта. Это дает вам это в файле:

city,PartOf,municipality
Meppel,PartOf,Meppel
Nijeveen,PartOf,Meppel
Rogat,PartOf,Meppel

Теперь я хотел бы получить эти данные в MarkLogic. И я могу импортировать csv-файлы, могу импортировать тройки, но не могу понять комбинацию.


person Anton Verver    schedule 16.12.2015    source источник
comment
Пожалуйста, добавьте пример CSV и того, что вы уже пробовали.   -  person Mr Mush    schedule 16.12.2015


Ответы (2)


Я бы предложил немного переписать его, чтобы он соответствовал формату N-Triples, придав ему .nt, а затем с помощью MLCP загрузить его как input_type rdf.

ХТХ!

person grtjn    schedule 11.02.2016

Вы можете использовать Google Refine для преобразования данных CSV в RDF. После этого MLCP можно использовать для отправки этих данных. Вы можете сделать что-то вроде этого -

$ mlcp.sh import -username user -password password -host localhost \
    -port 8000 -input_file_path /my/data -mode local \
    -input_file_type rdf 

Дополнительную информацию о загрузке троек с помощью MLCP можно найти на этой странице сообщества MarkLogic.

person Ankit Bhardwaj    schedule 04.05.2016