Giraph, Hadoop, Spark и Cassandra

Могу ли я использовать Giraph, если у меня есть кластеры Spark и Cassandra, но нет кластеров Hadoop?

В настоящее время я использую GraphX ​​и вместо этого хотел бы использовать Giraph. Возможно ли это, учитывая, что у меня есть кластеры Spark и я использую Cassandra?


person BigBug    schedule 02.04.2017    source источник


Ответы (1)


Много лет назад у меня был лишь ограниченный опыт работы с Giraph, и я никогда не пытался использовать его за пределами кластера Hadoop. Но похоже, что то, что вы хотите, по крайней мере технически возможно, если не обязательно легко.

Этот code является дополнением к Practical Graph Analytics with Apache Giraph. Как видите, он требует Hadoop в пути к классам, например, для DoubleWritable и Text, но ничего не делает с кластером Hadoop. Вместо этого он работает с массивами в памяти. Похоже, все, что вам нужно сделать, это реализовать compute в BasicComputation class, чтобы делать с Cassandra все, что вам нужно, пока вы поддерживаете Hadoop в качестве зависимости, чтобы удовлетворить ограничения типов для BasicComputation.

Я никогда не находил Giraph ужасно интуитивным, но, надеюсь, вы сможете заставить эту нетрадиционную настройку работать.

person Vidya    schedule 02.04.2017
comment
Будет ли downvoter указать причину? Ответственные пользователи понимают, что отрицательные голоса предназначены для крайних случаев, и если что-то не так, комментарии и правки лучше. Альтернативный ответ, который принимает ОП, был бы лучшим. Так в чем же проблема? Мы все с нетерпением ждем вашего вклада. - person Vidya; 04.04.2017
comment
Рад помочь. Удачи с вашим проектом! - person Vidya; 06.04.2017