Значения вершин массива для Apache Giraph

Мне нужно обработать граф, который имеет массивы (двойные) для их значения вершины, а не одного двойного. Таким образом, входной формат будет следующим: vertex_Id(строка)\t vertex_value (массив)\t соседей. Глядя на документацию, кажется, что нет класса, поддерживающего такой формат. Какие варианты у меня есть для подачи ввода в этом формате в Giraph?


person vmontazeri    schedule 08.05.2017    source источник


Ответы (1)


Вы должны адаптировать один формат ввода или написать свой собственный. Посмотрите на это и это, например. Вы должны подумать об использовании разделителей, которые не могут быть частью элементов вашего графика, с идеей, что это облегчит работу по разбору строк вашего входного файла через ваш входной формат.

person chomp    schedule 09.05.2017