Не повредит ли их регулярная работа nodetool repair
на моих узлах Cassandra?
В FAQ по планете Кассандра отмечается (выделено мной), что
Антиэнтропийное восстановление узла - для данных, которые не читаются часто, или для обновления данных на узле, который не работал в течение длительного периода, процесс восстановления узла (также называемый антиэнтропийным ремонтом) гарантирует, что все данные на узле реплика сделана согласованной. Восстановление узлов (с помощью утилиты nodetool) следует запускать регулярно как часть регулярных операций по обслуживанию кластера.
Это единственное упоминание о регулярном nodetool repair
запуске, которое я видел. Регулярно запускать его не составит труда, если оно дешевое, но насколько оно дорого? Выполняет ли он эквивалент чтения с проверкой согласованности каждой записи на узле? Или это умнее этого? В документации упоминается использование деревьев Меркла, но это не дает мне представления о том, насколько дорога эта операция.
Если у вас есть 500 ГБ данных на узле, и этот узел фактически согласуется с другими узлами (восстановление не выполняется), о том, сколько данных выполняется при восстановлении, считываемых с диска (чтение всех 500 ГБ заняло бы пару секунд). часов)? И о том, сколько данных отправляется по локальной сети (отправка всех 500 ГБ по локальной сети может занять еще час или около того).