Я планирую настроить мультицентр обработки данных Cassandra 2 с 2-4 узлами на центр обработки данных и несколькими десятками центров обработки данных. У нас есть пространства ключей, реплицированные на определенное количество узлов в каждом центре обработки данных. У нас есть развертывание на основе vnode. Таким образом, токены должны автоматически назначаться узлам.
Документация на http://www.datastax.com/documentation/cassandra/2.0/cassandra/operations/ops_add_node_to_cluster_t.html предполагает, что добавление нового узла требует выполнения очистки на всех остальных узлах кластера. Однако в нем не разъясняется процедура установки нескольких центров обработки данных.
Насколько я понимаю, очистка nodetool удаляет данные, которые больше не принадлежат этому узлу. Когда настраивается новый центр обработки данных, мы создаем совершенно новые реплики и AFAICT, это не приводит к перемещению/перебалансировке данных за пределами этого нового центра обработки данных, и, следовательно, нет необходимости в очистке узлов других центров обработки данных. Кто-нибудь может подтвердить правильность моего понимания и не требуется ли очистка на узлах других центров обработки данных?