Сбой автоопределения ведомых устройств Yarn

Это то, чего я нигде не нашел.

У меня есть кластер YARN с некоторыми подчиненными. Когда ведомое устройство выходит из строя (обезьяна хаоса, уменьшение масштаба и т. д.), ResourceManager не «понимает это». Даже rmadmin -refreshNodes не исправит. ResourceManager продолжает перечислять неисправные узлы как RUNNING. Как мне сделать, чтобы ResourceManager проверял работоспособность ведомых устройств и удалял их в случае сбоя?


person Luís Guilherme    schedule 10.06.2015    source источник


Ответы (1)


Пожалуйста, ознакомьтесь с Полным руководством Hadoop, глава 10, Техническое обслуживание, ввод в эксплуатацию и вывод из эксплуатации узлов. Похоже, вы пытаетесь обновить средство отслеживания заданий с помощью приведенной выше команды. Там упоминается более сложный процесс, наряду с обновлением узла имени, проверкой хода выполнения в веб-интерфейсе и удалением узлов из включаемого файла и подчиненного файла.

person Ramzy    schedule 10.06.2015