Настройка производительности таблиц HIVE с использованием индекса - работает и проблемы?

У меня есть таблица кустов external abc с 3 столбцами -

c1 string,
c2 int, 
c3 string

Я создал COMPACT index в столбце c1 как часть инструкции create index с отложенной перестройкой.

Теперь я делаю alter index on abc with rebuild; поэтому моя индексная таблица загружается смещениями и данными.

Вот мои запросы:

1) должен ли я запросить базовую таблицу abc, чтобы увидеть улучшение производительности?

2) должен ли я запрашивать новую индексную таблицу?

3) это единственное свойство, которое нужно установить - set hive.optimize.index.filter=true?

Несмотря на индексацию столбца c1, когда я запрашиваю таблицу abc с условиями фильтрации в столбце c1, я не вижу никакого улучшения производительности; даже план explain не показывает случая использования index.

В чем проблема? может кто-нибудь направить меня, спасибо.


person user3739108    schedule 13.06.2014    source источник