Я хотел бы построить дерево B +, которое охватывает многоузловую
компьютерную сеть (внутренняя подсеть компьютеров с Linux) для эластичного массивного хранилища. Сканирование дальности важно.
Является ли это базовой структурой данных
распределенных систем БД? (Кассандра, HBase)
Есть ли какие-нибудь исследования по распределенным деревьям B +?
Я видел статью на сайте
http://www.cs.yale.edu/homes/aspnes/papers/opodis2005-b-tree-final.pdf
но пропустите BT удалить неисправные узлы (чтобы произошла потеря данных)
Меня особенно интересуют деревья B + со встроенной избыточностью
(например, если узел выходит из строя и все узлы на нем отключены,
я бы хотел, чтобы другой реплицированный узел стал основным узлом
сервер и занять место вышедшего из строя хоста)
Я не хочу использовать коллекцию экземпляров БД
(1 узел, одна БД), поскольку сегментирование не является хорошим выбором
для крупномасштабируемой системы хранения (для массового оборудования x86, x64 с FOSS ОПЕРАЦИОННЫЕ СИСТЕМЫ).
Придумываю ли я велосипед?
Что лучше: использовать Cassandra или HBase?