Я до сих пор не совсем понимаю эту «зернистость сегмента» в Друиде. Эта страница довольно неоднозначна: http://druid.io/docs/latest/design/segments.html . Он продолжает упоминать segmentGranularity, но больше говорит об интервалах (в первом абзаце).
Во всяком случае, на данный момент объем моих данных не так уж велик. На этой странице упоминается, что 300-700 МБ - это «идеальный» размер сегмента. На самом деле я могу уместить данные за неделю в один сегмент. Вот почему я думаю установить для segmentGranularity значение «неделя» в моей задаче индексирования json:
"granularitySpec" : {
"type" : "uniform",
"segmentGranularity" : "week",
"queryGranularity" : "none",
"intervals" : ["2015-09-12/2015-09-13"]
},
Тем не менее, я планирую выполнять пакетную индексацию каждый час (и обычно это будет (повторно) обрабатывать данные только в течение того же дня). Вот почему я указал только один интервал, который охватывает один день, в поле «интервалы» выше.
Мой вопрос: как это будет работать, если для параметра segmentGranularity установлено значение неделя (вместо дня)? Будет ли он перестраивать куб для всего отрезка (недели)? Чего я не хочу; Я хочу только пересобрать куб за день.
Спасибо, Рака