Storm как замена многопоточного подхода Consumer/Producer для обработки больших объемов?

У нас есть существующая установка, в которой восходящие системы отправляют нам сообщения в очередь сообщений, и мы обрабатываем эти сообщения. Содержимое — это xml, и мы просто разматываем. За этим шагом разупорядочения следует запись в БД (чтобы поместить соответствующие значения в соответствующие столбцы) . Система настроена на взаимодействие со многими другими вышестоящими системами, и наши объемы будут увеличиваться до максимального размера 40 мм в день.

Наш текущий способ обработки — прослушиватели в очередях, а затем несколько потоков производителей и потребителей, которые выполняют десортировку и последующую запись в БД.

Мой вопрос: может ли этот процесс вписаться в сценарий использования Storm? Я имею в виду, может ли MQ быть моим носиком, и у меня есть 2 болта, один из которых нужно разобрать, а затем он становится носиком для следующего болта, который записывает в базу данных?

Если да, то какую пользу я могу извлечь? Это прощание с громоздким многопоточным шаблоном кода производителя/работника. Если это так же просто, как описано выше, то где/почему можно было бы прибегнуть к обычному многопоточному подходу к сценарию производителя/потребителя. Я хочу сказать, что существует объем/частота данных, при которых Storm начинает сиять по сравнению с обычным подходом.

PS: я очень новичок в этом и пытаюсь понять это и хочу убедиться, что ход мыслей правильный.

С уважением, ЦВМ.


person Chetya    schedule 12.04.2013    source источник
comment
Этот вопрос, вероятно, слишком широк, чтобы на него можно было эффективно ответить здесь, на SO. Возможно, вам больше повезет в списке рассылки storm-users.   -  person G Gordon Worley III    schedule 13.04.2013


Ответы (1)


Определенно этот сценарий может вписаться в топологию шторма. Горлышки могут вытягиваться из MQ, а болты могут выдерживать расстановку и последующую обработку.

Основным преимуществом по сравнению с обычным многопоточным шаблоном является возможность добавления дополнительных рабочих узлов по мере увеличения нагрузки. Это не так просто с традиционными моделями производителя-потребителя.

Конкретный номер тома данных — это очень широкий вопрос, поскольку он зависит от большого количества факторов, таких как аппаратное обеспечение и т. д.

person techuser soma    schedule 13.04.2013