Распределенная сеть B + деревья

Я хотел бы построить дерево B +, которое охватывает многоузловую
компьютерную сеть (внутренняя подсеть компьютеров с Linux) для эластичного массивного хранилища. Сканирование дальности важно.

Является ли это базовой структурой данных
распределенных систем БД? (Кассандра, HBase)

Есть ли какие-нибудь исследования по распределенным деревьям B +?
Я видел статью на сайте
http://www.cs.yale.edu/homes/aspnes/papers/opodis2005-b-tree-final.pdf
но пропустите BT удалить неисправные узлы (чтобы произошла потеря данных)

Меня особенно интересуют деревья B + со встроенной избыточностью
(например, если узел выходит из строя и все узлы на нем отключены,
я бы хотел, чтобы другой реплицированный узел стал основным узлом
сервер и занять место вышедшего из строя хоста)

Я не хочу использовать коллекцию экземпляров БД
(1 узел, одна БД), поскольку сегментирование не является хорошим выбором
для крупномасштабируемой системы хранения (для массового оборудования x86, x64 с FOSS ОПЕРАЦИОННЫЕ СИСТЕМЫ).

Придумываю ли я велосипед?
Что лучше: использовать Cassandra или HBase?


person Community    schedule 13.12.2011    source источник


Ответы (1)


Cassandra поддерживает запросы диапазона.

Большая таблица Google автоматически добавляет новые машины в кластер, когда вы включаете машину. Это очень эластично и легко добавить больше машин. К сожалению, у его скорости есть недостаток: запросы очень ограниченны. Вы можете выполнить несколько запросов по диапазону. См. Список и дополнительные сведения в этой статье: http://geothought.blogspot.com/2009/04/google-app-engine-and-bigtable-very.html

Отличный пример хранения данных в Big Table: http://jimbojw.com/wiki/index.php?title=Understanding_Hbase_and_BigTable

Хороший пост о переполнении стека: хранение массивных упорядоченных данных временных рядов в bigtable деривативы

person Adrian    schedule 17.12.2011