Было бы здорово, если бы кто-нибудь мог объяснить мне архитектурные различия между Twitter Storm и Apache Hadoop? Я ищу некоторые внутренние вещи, помимо пакетной обработки в реальном времени. Поскольку обе технологии довольно похожи с точки зрения написания топологии для Storm или map-reduce на Hadoop, с точки зрения трекера задач / трекера заданий для Hadoop и эквивалентного нимба / супервизора для Storm, с точки зрения раздела Hadoop и эквивалентного перемешивания (случайное , поле и т. д.) на Storm и т. д. (Правильно ли я говорю, что Storm использует внутренние очереди сообщений для передачи данных между носиками / болтами, что не совсем так с Hadoop, где создаются промежуточные файлы и, следовательно, ввод-вывод вовлеченный.)
РЕДАКТИРОВАТЬ:
Я рассмотрел вопрос Apache Storm по сравнению с Hadoop, но принят ответ оставляет меня с желанием знать больше, чем просто вариант использования, то есть пакетную обработку в реальном времени или пакетную обработку.