Сбой автоопределения ведомых устройств Yarn

Это то, чего я нигде не нашел.

У меня есть кластер YARN с некоторыми подчиненными. Когда ведомое устройство выходит из строя (обезьяна хаоса, уменьшение масштаба и т. д.), ResourceManager не «понимает это». Даже rmadmin -refreshNodes не исправит. ResourceManager продолжает перечислять неисправные узлы как RUNNING. Как мне сделать, чтобы ResourceManager проверял работоспособность ведомых устройств и удалял их в случае сбоя?

Luís Guilherme 10.06.2015 источник

Ответы (1)

arrow_upward
0
arrow_downward

Пожалуйста, ознакомьтесь с Полным руководством Hadoop, глава 10, Техническое обслуживание, ввод в эксплуатацию и вывод из эксплуатации узлов. Похоже, вы пытаетесь обновить средство отслеживания заданий с помощью приведенной выше команды. Там упоминается более сложный процесс, наряду с обновлением узла имени, проверкой хода выполнения в веб-интерфейсе и удалением узлов из включаемого файла и подчиненного файла.

Ramzy 10.06.2015

Сбой автоопределения ведомых устройств Yarn

Ответы (1)

Вопросы по теме