Я создал кластер Cassandra с 2 контроллерами домена. DC1 — 9 узлов, rep 5, согласованность — локальный кворум. DC2 — 4 узла, rep 3, согласованность — локальный кворум. Тестировали резервное копирование и восстановление и заметили, что восстановление узла занимает очень много времени после восстановления данных. System.log и compactionstats показывают, что большая часть времени тратится на перестроение вторичных индексов. Ищем ответы на:
Есть ли способ резервного копирования и восстановления вторичного индекса? Как Cassandra восстанавливает вторичный индекс? он всегда проходит полный ребилд? Есть ли способ специально исключить перестроение вторичного индекса из процесса восстановления nodetool?
Стратегия резервного копирования: на основе моментальных снимков, хранящихся в облаке. Индекс хранения каталогов Lucene также резервируется.
Стратегия восстановления: Восстановите sstables из моментальных снимков, скопируйте обратно каталог Lucene.