У нас есть серверы Cassandra 1.1.1 со стратегией выравнивания уплотнения.
Система работает так, что есть операции чтения и удаления. Каждые полгода мы удаляем примерно половину данных при поступлении новых данных. Иногда бывает, что использование диска достигает 75%, хотя мы знаем, что реальные данные занимают около 40-50%, остальное пространство занято надгробиями. Чтобы избежать переполнения диска, мы принудительно уплотняем наши таблицы, понижая все SSTables до уровня 0. Для этого мы удаляем файл манифеста .json и перезапускаем узел Cassandra. (опция gc_grace не помогает, так как уплотнение начинается только после заполнения уровня)
Начиная с Cassandra 2.0 файл манифеста был перемещен в сам файл sstable: https://issues.apache.org/jira/browse/CASSANDRA-4872.
Мы рассматриваем возможность перехода на Cassandra 2.x, но опасаемся, что у нас больше не будет такой возможности, как принудительное выравнивание уплотнения.
Мой вопрос: как мы можем добиться, чтобы наша таблица имела ограничение на дисковое пространство, например. 150 ГБ? (При превышении лимита уплотнение запускается автоматически). Вопрос в основном по Cassandra 2.x. Хотя любые альтернативные решения для Cassandra 1.1.1 также приветствуются.