У меня есть кластер с одним главным узлом и 3 вычислительными узлами. Докер-контейнер на узлах 1 и 2 может «закручиваться» к главному узлу. Однако узел-3 завершается с ошибкой «Отказано в соединении».
- пинг из контейнера работает
- ping и curl с хоста контейнера работают (т.е. узел-3 для мастера)
- отключение docker0 работало для узла 1 и 2. не для узла 3 (https://serverfault.com/questions/642981/docker-containers-cant-resolve-dns-on-ubuntu-14-04-desktop-host)
- не помогло: setsebool -P httpd_can_network_connect on
- firewalld неактивен на других узлах, поэтому попытался отключить его и на узле-3.
что еще я могу искать?
ОБНОВИТЬ
спасибо @ sxm1972, нашел эту, возможно, нежелательную запись в списке «docker network ls»
f49b6c9541d2 docker_gwbridge локальный мост
как мне избавиться от этого?
удалил его, используя: docker network rm f49b6c9541d2 sudo service перезапуск докера
но это не решило проблему завитка
ОБНОВИТЬ
Затем посмотрел /etc/hosts node3 содержит неожиданную строку:
192.168.1.1 079543e73dc7
вместо этого другие узлы имеют IP-адрес, например 172.17.0.x.
192.168.1.1 относится к IP-адресу главного узла.
ОБНОВИТЬ
ifconfig на узлах node1 и node2 показывает 172.17.0.x для интерфейса docker0
ifconfig на node3 показывает 192.168.xx: это кажется поврежденным.
Возможно, я непреднамеренно сделал что-то с IP-адресом node3. Как я могу восстановить его?
ОБНОВИТЬ
Пытался
ip link del docker0
sudo service docker restart
host docker0 IP по-прежнему кажется неправильным
РЕШЕНИЕ
Спасибо @sxm1972! сработало следующее:
sudo service docker stop
create/edit daemon.json from the link below setting bip to 172.17.0.1/16
ip link del docker0
sudo service docker restart
Теперь я могу "скручиваться" из контейнера