HBASE: Операции, связанные с семейством столбцов, постфактум?

Есть ли способ разделить семейство столбцов на несколько семейств постфактум в HBase?

Это явно плохая идея, но в некоторых случаях она может быть полезной, т.е.

1) если у вас есть достаточно времени, чтобы отключить сервер HBase и увидеть возможность оптимизировать некоторые задания mapreduce, которые связаны всего с парой столбцов.

2) вы импортируете из sqoop (нет эксперта по sqoop, но по умолчанию отображается отображение каждой строки базы данных в одно семейство столбцов - исправьте, если ошибаетесь).

3) вы просто упустили из виду некоторые шаблоны доступа в начале своего приложения.

Связанные

Есть ли способ объединить семейства столбцов в новую таблицу (т. е. когда кардинальность отклоняется настолько, что было бы лучше сделать это для повышения производительности)?


person jayunit100    schedule 01.07.2013    source источник


Ответы (1)


Мы сделали это с помощью массовой загрузки. Нам пришлось написать задание MR, чтобы разделить одно семейство столбцов на 2 семейства столбцов с помощью HFileOutputFormat.

Этот вывод был загружен в hbase с помощью completebulkload

person satish    schedule 02.07.2013
comment
Невероятно важно с самого начала спроектировать правильное семейство столбцов. Для нас он изначально был разработан с использованием множества концепций SQL (слишком нормализовано). - person satish; 12.07.2013