Схема звездочки - факт или измерение внешнего идентификатора?

Вот вопрос, с которым я борюсь при проектировании звездообразной схемы.

Схема такова, что мы отслеживаем пакеты со встроенными глобально уникальными идентификаторами (тегами). Каждый из этих тегов создает серию хронологических событий. Я считаю события фактами и включаю постоянно изменяемые значения в качестве столбцов в таблицу фактов. Размеры - это такие вещи, как тип упаковки.

В чем я не уверен, так это в том, должен ли идентификатор тега находиться в измерении или непосредственно в таблице фактов. В настоящее время мы отслеживаем более 5 миллионов уникальных тегов.

Целесообразен ли такой большой размер?


person ishmeister    schedule 11.08.2016    source источник
comment
Если идентификатор тега является основным бизнес-ключом для идентификации пакета, он должен оставаться в таблице фактов.   -  person tobi6    schedule 11.08.2016


Ответы (1)


Это вырожденное измерение, и вам следует сохранить этот столбец в таблице фактов.

person Marek Grzenkowicz    schedule 11.08.2016