check_disk не генерирует предупреждения: nagios

Я новичок в нагиос.

Я пытаюсь настроить службу «check_disk» для одного хоста, но не получаю ожидаемых результатов.

Я должен получать электронные письма, когда использование диска превышает 80%.

Итак, для этой задачи уже определен сервис с несколькими хостами, как показано ниже:

    define service{
            use                             local-service         ; Name of service template to use
            host_name                       localhost, host1, host2, host3, host4, host5, host6
            service_description             Root Partition
            check_command                   check_local_disk!20%!10%!/
            contact_groups                  unix-admins,db-admins
            }
  • Проблема:

Далее я попытался протестировать один хост, то есть «host2». Текущее использование host2 выглядит следующим образом:

    # df -h /
    Filesystem                  Size  Used Avail Use% Mounted on
    /dev/mapper/rootvg-rootvol   94G   45G   45G  50% /

Итак, чтобы получать мгновенные электронные письма, я написал еще один сервис, как показано ниже, где для предупреждения установлено значение ‹60%, а для критического значения установлено значение ‹40%.

    define service{
            use                             local-service
            host_name                       host2
            service_description             Root Partition again
            check_command                   check_local_disk!60%!40%!/
            contact_groups                  dev-admins
            }

Но до сих пор я не получаю никаких писем для того же самого.

Где это идет не так.

Команда «check_local_disk» определяется следующим образом:

    define command{
            command_name    check_local_disk
            command_line    $USER1$/check_disk -w $ARG1$ -c $ARG2$ -p $ARG3$
            }

person Community    schedule 16.09.2015    source источник


Ответы (1)


В настоящее время ваше определение команды настроено на проверку только диска вашего сервера Nagios, а не удаленных хостов (например, host2). Вам необходимо определить новое определение команды для выполнения check_disk на удаленном хосте через NRPE (удаленное выполнение подключаемого модуля Nagios).

На сервере Nagios определите следующее:

define command {
        command_name                    check_remote_disk
        command_line                    $USER1$/check_nrpe -H $HOSTADDRESS$ -c check_disk -a $ARG1$ $ARG2$ $ARG3$
        register                        1
}


define service{
        use                             genric-service
        host_name                       host1, host2, host3, host4, host5, host6
        service_description             Root Partition
        check_command                   check_remote_disk!20%!10%!/
        contact_groups                  unix-admins,db-admins
}

Перезапустите службу Nagios.

На удаленном хосте:

  • Ensure you have NRPE plugin installed.
  • Убедитесь, что на удаленном хосте определена команда для check_disk. Обычно это включается в nrpe.cfg, но закомментируется. Вам придется раскомментировать строку.
  • Убедитесь, что на удаленном хосте установлен плагин check_disk. Моя находится по адресу: /usr/lib64/nagios/plugins/check_disk
  • Убедитесь, что поле allowed_hosts в nrpe.cfg содержит IP-адрес/имя хоста вашего сервера Nagios.
  • Убедитесь, что поле dont_blame_nrpe в nrpe.cfg установлено на 1, чтобы разрешить аргументы командной строки для команд NRPE: dont_blame_nrpe=1
  • Если вы внесли какие-либо изменения, перезапустите службу nrpe.
person Joe Young    schedule 16.09.2015
comment
Это потрясающе ! Благодарю. Кроме того, я хочу знать, как я могу отправить электронное письмо только при первой проверке проблемы, т. Е. Использование диска достигает > 90%, и остановить уведомление для следующей проверки до восстановления. - person ; 16.09.2015
comment
Измените определение службы и добавьте следующую строку: notification_interval 0 - person Joe Young; 16.09.2015