Я только что прочитал это руководство по Hadoop, в котором говорится, что у Hadoop есть ахиллово сухожилие ( единая точка отказа) в JobTracker
:
JobTracker — это единственная точка отказа для службы Hadoop MapReduce, что означает, что если JobTracker выйдет из строя, все запущенные задания будут остановлены.
А также эту статью, в которой говорится, что NameNode
является SPOF:
Единственная точка отказа в кластере Hadoop — это NameNode.
Единичные точки отказа — это плохо, ладно? Какие стратегии/методы/инструменты/и т. д. можно ли обойти эти SPOF и сделать Hadoop избыточным, отказоустойчивым и отказоустойчивым (внимание, модное слово!)?