У меня есть несколько разных «измерений», в основном иерархических. Я хотел бы запустить некоторые показатели, сохраненные на отдельных уровнях иерархии. Когда вы перемещаетесь по этой иерархической структуре, метрики обновляются в зависимости от вашего текущего выбора.
В традиционных системах OLAP у вас есть несколько таблиц измерений с таблицей фактов, и вы выполняете ETL, чтобы получить данные в свое хранилище данных и выполнить запросы к ним. Я хотел бы сделать это почти в реальном времени. Выполнение этого в режиме реального времени означает, что ETL должны выполняться почти в реальном времени (вероятно, точки данных кэшируются в памяти).
Если иерархическая структура (X -> Y -> Z), то если у меня есть 5 X, 2 Y и 5 Z в качестве измерения, мне нужно выполнить (5 * 2 * 5) => 50 запросов, чтобы заполнить таблицу фактов. ? Если эта иерархия станет больше, я легко смогу запустить миллионы запросов. Я не уверен, правильно ли я думаю об этой проблеме, было бы очень полезно, если бы кто-то с опытом анализа данных в реальном времени мог поделиться своим опытом.