Я хочу вывести узлы Cassandra из эксплуатации, поскольку узлам требуется обновление версии с 3.9 до 3.11. Я вхожу в систему на определенном узле и выполняю команду списание nodetool.
Большинство узлов выводятся из эксплуатации из кластера в течение нескольких часов работы, но в некоторых случаях вывод из эксплуатации застревает, и узел не удаляется из кластера, статус / состояние: UL. Первоначально данные передаются через разные узлы, и кажется, что все работает нормально, журналов ошибок нет, но через много часов они остаются в том же состоянии.
Я намерен проверить успешность вывода из эксплуатации с помощью nodetool netstats и nodetool status, вывод которых приведен ниже. В обоих местах написано «УХОД».
nodetool netstats
Mode: LEAVING
Not sending any streams.
Read Repair Statistics:
Attempted: 62537724
Mismatch (Blocking): 921768
Mismatch (Background): 746828
Pool Name Active Pending Completed Dropped
Large messages n/a 0 44148788 0
Small messages n/a 1 238868718622 143
Gossip messages n/a 0 17713062 0
nodetool status
Datacenter: XXXX
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
-- Address Load Tokens Owns Host ID Rack
UL x.x.x.x 554.42 GiB 256 20.2% b2d0fe01-a0ce-4f41-b410-0dcf4aa7f5ef rack1
Опять же, после перезапуска службы Cassandra она переходит в состояние UP / NORMAL, и я повторяю тот же процесс до вывода из эксплуатации. Для некоторых узлов он выводится из эксплуатации за одну попытку, но для других требуется несколько попыток для успешного вывода из эксплуатации.
Machine Information: Linux 4.4.0-101-generic x86_64 GNU/Linux
Average Load on each node : ~500GB
Каким должен быть следующий шаг к более эффективному выводу из эксплуатации?