Как ускорить nagios для мониторинга хостов через облако

при использовании nagios с несколькими хостами, разбросанными по сети, статус хостов показывает заметное отставание, и требуется много времени, чтобы отразить его на cgi сервера nagios. Таким образом, какова оптимальная конфигурация nrpe/nagios для ускорения процесса статуса для среды распределенного хоста. В моем случае я использую сервер/клиенты nagios core 4.1 nrpe 1.5: Amazon ec2


person khakishoiab    schedule 14.10.2016    source источник


Ответы (1)


Графический интерфейс обычно обновляется только один раз в минуту (автоматически), хотя нажатие кнопки «Обновить» может предоставить вам «почти» самую последнюю информацию. Я говорю «почти», потому что внутри ядра Nagios есть отдельный цикл обработки, из-за которого он никогда не работает в режиме реального времени. NRPE будет работать со скоростью вашего сетевого подключения — он мало что делает, кроме отправки и получения небольших объемов данных. Единственная задержка здесь - это время, необходимое для фактического выполнения проверки и отправки ответа, что, конечно же, связано со многими факторами. Попробуйте посмотреть на вывод

[nagioshome]/bin/nagiostats

Есть несколько записей, которые сообщают вам:

'Latency' - the time between when the check was scheduled to start, and the actual start time.

'Execution Time' - the amount of time checks are actually taking to run.

Эти записи будут иметь три числа, а именно; Мин. / Макс. / Среднее

Высокие значения задержки (в моей книге это означает, что средняя задержка больше 1 секунды) обычно означает, что ваш сервер Nagios перегружен. Есть несколько вещей, которые вы можете сделать, чтобы уменьшить время задержки, и они описаны в файле nagios.cfg. Эта задержка не имеет ничего общего со скоростью сети или скоростью NRPE — это в первую очередь аппаратная скорость. Если вы уже используете оптимальные значения, указанные в nagios.cfg, то пришло время найти более быстрое оборудование.

Высокое время выполнения (для меня в среднем более 5 секунд) можно винить практически во всем, кроме вашей системы Nagios. Это может быть вызвано неисправными сетями (неправильная маршрутизация пакетов). ), перегруженные сети, ошибочные и/или плохо спроектированные проверки, медленные целевые системы... список можно продолжать до бесконечности. Ничто из того, что вы делаете с конфигурациями Nagios и/или NRPE, не поможет снизить эти значения. Что ж, вы можете отключить шифрование NRPE, чтобы улучшить время передачи; но если у вас изначально включено шифрование, то вряд ли вы захотите его отключить.

person Jim Black    schedule 16.10.2016