Я настроил кластер Kubernetes с одним главным узлом и двумя рабочими узлами, используя kubeadm
, и пытаюсь понять, как восстановить работу после сбоя узла.
Когда рабочий узел выходит из строя, восстановление выполняется просто: я создаю новый рабочий узел с нуля, запускаю kubeadm join
, и все в порядке.
Однако я не могу понять, как восстановиться после сбоя главного узла (не прерывая развертывания, запущенные на рабочих узлах). Нужно ли мне делать резервную копию и восстанавливать исходные сертификаты, или я могу просто запустить kubeadm init
, чтобы создать новый мастер с нуля? Как мне присоединиться к существующим рабочим узлам?