Мне нужно обработать граф, который имеет массивы (двойные) для их значения вершины, а не одного двойного. Таким образом, входной формат будет следующим: vertex_Id(строка)\t vertex_value (массив)\t соседей. Глядя на документацию, кажется, что нет класса, поддерживающего такой формат. Какие варианты у меня есть для подачи ввода в этом формате в Giraph?
Значения вершин массива для Apache Giraph
Ответы (1)
Вы должны адаптировать один формат ввода или написать свой собственный. Посмотрите на это и это, например. Вы должны подумать об использовании разделителей, которые не могут быть частью элементов вашего графика, с идеей, что это облегчит работу по разбору строк вашего входного файла через ваш входной формат.
person
chomp
schedule
09.05.2017