У меня есть два текстовых файла, назовите их A.txt и B.txt. И A.txt, и B.txt имеют 3 поля. Но семантика другая. Назовем эти поля следующим образом:
A.txt : f1, f2, f3
B.txt : f1, f2, f4
A.txt и B.txt имеют одинаковые значения для f1 и f2, но имеют другое третье поле.
Я хотел бы импортировать эти файлы в Solr (я использую Solr 4.5). Но предостережение заключается в том, что соответствующие записи из A.txt и B.txt должны быть объединены в один документ. Так, например, если у нас есть:
A.txt
1,50,foo
51,100,bar
B.txt
1,50,xkcd
51,100,qc
После импорта данных в Solr должно быть 2 документа:
1,50,foo,xkcd
51,100,bar,qc
Если бы документы хранились в базах данных SQL, это был бы простой запрос на соединение. Но поскольку документы хранятся в виде строк в файле CSV, и я использую LineEntityProcessor с функцией преобразования для импорта данных, есть ли способ выполнить эту задачу?