Использование расширения эмиттера графита друида

Я пробую плагин излучателя графита в друиде для сбора определенных показателей друидов в графите во время тестов производительности друидов. Намерение состоит в том, чтобы затем запросить эти метрики с помощью REST API, предоставляемого графитом, чтобы охарактеризовать производительность развертывания.

Однако числа, возвращаемые графитом, не имеют смысла. Итак, я хотел проверить, правильно ли я интерпретирую результаты.

Настройка

  • Служба индексирования kafka используется для приема данных из kafka в druid.
  • Я включил эмиттер графита и предоставил белый список показателей для сбора.
  • Затем я отправил 5000 событий в индексируемую тему kafka. Используя инструменты, связанные с kafka, я подтвердил, что сообщения действительно хранятся в журналах kafka.
  • Затем я получил ingest.rows.output metric из графита, используя следующий вызов:

curl "http://Graphite_IP:Graphite_Port> /render/?target=druid.test.ingest.rows.output&format= csv "

  • Вот результаты, которые я получил:
druid.test.ingest.rows.output,2017-02-22 01:11:00,0.0 
druid.test.ingest.rows.output,2017-02-22 01:12:00,152.4 
druid.test.ingest.rows.output,2017-02-22 01:13:00,97.0 
druid.test.ingest.rows.output,2017-02-22 01:14:00,0.0

Я не знаю, как интерпретировать эти числа:

Вопросы

  1. Что означают числа 152,4 и 97,0 в выходных данных?
  2. Как «количество строк» ​​может быть значением с плавающей запятой, например 152,4?
  3. Как эти цифры соотносятся с сообщениями "5000", которые я отправил Kafka?

Заранее спасибо,

Джитин


person jithinpt    schedule 22.02.2017    source источник


Ответы (2)


Согласно метрикам druid page он указывает количество событий после объединения. Наблюдаемое значение с плавающей запятой связано с вычислением среднего значения за период времени, который графитовый сервер использует для суммирования данных. Итак, если эти метрики полные, это означает, что ваши начальные 5000 строк были сжаты примерно до 250 строк.

person Slim Bouguerra    schedule 22.02.2017
comment
если графитовые числа являются средними, то как может общее количество строк быть суммой двух чисел (т. е. 250). Кроме того, какое количество усредняется? - person jithinpt; 23.02.2017

Я понял проблему после некоторых экспериментов. Поскольку моя тема kafka имеет несколько разделов, druid запускает несколько задач для индексации данных kafka (одна задача на раздел). Каждая из этих задач сообщает различные показатели через регулярные промежутки времени. Для каждой метрики число, полученное из графита для каждого временного интервала, является средним из значений, сообщенных всеми задачами для метрики в этом интервале. В моем случае выше, если бы функция агрегирования была суммой (а не средней), значение, полученное из графита, было бы 5000.

Однако мне не удалось выяснить, выполняется ли усреднение плагином graphite-emitter druid или графитом.

person jithinpt    schedule 23.02.2017