PageRankBenchmark — Уменьшить на 0% — пример Giraph

Я тестирую свою установку Giraph кластера с одним узлом, используя пример PageRankBenchmark, следующим образом:

$HADOOP_HOME/bin/hadoop jar   /usr/local/hadoop/share/hadoop/mapreduce/giraph-examples-1.1.0-for-hadoop-2.4.0-jar-with-dependencies.jar org.apache.giraph.benchmark.PageRankBenchmark -v -V 1000 -e 1 -s 5 -w 1

Но после того, как мапперы завершат свою работу, редукторы не запустятся (карта 100% редукция 0%, судя по консоли). Это подходящее поведение для этого алгоритма?

Если маппер запускается, редюсер должен начать принимать выходные данные карты в качестве входных данных и закончить работу (по крайней мере, во многих других реализациях алгоритма PageRank в Интернете всегда есть «Редуктор»). Но я гуглил, и всегда пример жирафа PageRankBenchmark заканчивается на Уменьшить на 0% в нескольких результатах этого алгоритма, запущенных другими людьми.

Итак, я не сейчас, если это нормально, в PageRankBenchmark, и я надеюсь, что кто-то может мне помочь здесь;)

Я использую Hadoop 2.4 с профилем Phadoop_yarn и Giraph 1.1.0.

Согласно нескольким другим вопросам, которые я читал, основная проблема с проблемой «Уменьшить зависание на 0%», вероятно, находится в журнале картографов, но я ничего там не нахожу (я их тоже прилагаю).

Вот мои журналы:

Ваше здоровье!


person chomp    schedule 24.03.2015    source источник


Ответы (1)


Жираф следует парадигме только карты. Другими словами, каждый рабочий связан с задачей карты. все вычисления выполняются только в рамках задачи карты, а связь между задачами карты для отправки/получения сообщений осуществляется с помощью zookeeper. Таким образом, это не похоже на традиционную парадигму программирования map-reduce, которая отображает выходные данные, передаваемые редюсерам. Следовательно, нет задачи уменьшения и вывода карты.

person Masoud Sagharichian    schedule 27.05.2015