Я хочу загрузить в Neo4j набор больших тройных файлов rdf. Я уже написал код сокращения карты для чтения всех входных n-троек и вывода двух файлов CSV: nodes.csv (7 ГБ - 90 миллионов строк) и Relations.csv (15 ГБ - 120 миллионов строк).
Я попробовал команду batch-import из Neo4j v2.2.0-M01, но она вылетает после загрузки около 30 миллионов строк узлов. У меня на компьютере 16 ГБ ОЗУ, поэтому я установил wrapper.java.initmemory = 4096 и wrapper.java.maxmemory = 13000. Итак, я решил разделить node.csv и Relations.csv на более мелкие части и запустить пакетный импорт для каждой части. Однако я не знаю, как объединить базы данных, созданные из нескольких операций импорта. Я ценю любые предложения о том, как загружать большие файлы CSV в Neo4j.