Может ли RethinkDB обрабатывать большие наборы данных (ТБ+) и служить БД для приложения OLAP?

Может ли RethinkDB эффективно обрабатывать большие наборы данных (т. е. несколько терабайт), чтобы служить в качестве базы данных для аналитического приложения?


person JE42    schedule 19.11.2013    source источник


Ответы (1)


Отказ от ответственности: я один из основателей RethinkDB. Извините за длинный ответ - вопрос на удивление нюансирован.

RethinkDB имеет очень гибкую архитектуру. Архитектура может масштабироваться от небольших экземпляров до крупных кластеров с большими объемами данных (определенно ТБ+) и эффективно выполнять широкий спектр запросов (OLTP, OLAP и т. д.).

Однако на практике мы в настоящее время сосредоточены на аспектах работы системы в реальном времени — большая часть оптимизаций, которые мы сейчас делаем, связана с потребностями приложений реального времени, создаваемых поверх RethinkDB. Обычно это рабочие нагрузки OLTP. Мы обязательно доберемся до оптимизации рабочих нагрузок в стиле OLAP, но в настоящее время это не является главным приоритетом.

Лучший способ узнать, сработает ли Rethink для вас, — попробовать его и провести нагрузочное тестирование. Вы должны быть в состоянии узнать довольно быстро, насколько хорошо все работает. (Если вы столкнулись с проблемами, пожалуйста, сообщите нам о них — мы будем рады помочь вам и устранить любые потенциальные проблемы).

person coffeemug    schedule 21.11.2013
comment
Спасибо за полезный ответ! Какая самая большая RethinkDB в производстве, о которой вы знаете? Это в однозначном диапазоне ТБ или вы бы сказали, что выше этого? - person JE42; 21.11.2013
comment
Я столкнулся с той же проблемой. У меня есть таблица с несколькими миллиардами записей, поэтому я предполагаю, что это как минимум несколько ГБ. В моем случае запуск немного медленный. Вы должны быть очень осторожны с вторичным индексом. Какой инструмент нагрузочного тестирования вы предлагаете для rethinkdb? - person Aman Gautam; 02.12.2013
comment
Привет, теперь, когда Rethink стал более зрелым, не могли бы вы опубликовать новый ответ? - person DevLounge; 15.01.2016
comment
Привет, очень интересно узнать больше об аналитических возможностях RethinkDB в отношении больших наборов данных (1–10 ТБ) теперь, когда RethinkDB стал более зрелым. - person Aviran Cohen; 02.06.2016
comment
@coffeemug Большое спасибо за ваш любезный ответ, но я действительно хотел бы знать, как обрабатывать большой объем данных с помощью простого запроса и о чем мне следует позаботиться и что я должен учитывать при создании индекса и как я могу определить индексное поле? Я задал вам много вопросов с одним предложением, и я уже подготовил ваш документ RethinkDB, но он был каким-то непонятным, чтобы не понять и не решить мою проблему. - person Dipak; 30.01.2018