HA-Pacemaker-Как вставить пользовательское сообщение об ошибке при сбое моего пользовательского ресурса?

Я использую Pacemaker + Corosync в Centos7, я создаю свой собственный агент ресурсов и создаю пользовательский ресурс, который запускает некоторые сценарии, которые у меня есть.

внутри моего агента ресурсов у меня есть функция мониторинга, которая проверяет что-то каждые x минут, и когда эта функция мониторинга не удалась, я возвращаю «OCF_ERR_GENERIC», и поэтому все повторные попытки не удались.

Когда я выполняю команду «Статус PCS», я вижу, что ресурс остановлен/сбой, а также вижу в «Неудачных действиях» сообщение о том, что не удалось с «неизвестной ошибкой»:

[root@pcmk01 opt]# pcs status
Cluster name: opt_cluster
Stack: corosync
Current DC: pcmk02-cr (version 1.1.15-11.el7_3.2-e174ec8) - partition with quorum
Last updated: Mon Jan 30 10:21:36 2017          Last change: Mon Jan 30 10:15:46 2017 by hacluster via crmd on pcmk02-cr

2 nodes and 5 resources configured

Online: [ pcmk01-cr pcmk02-cr ]

Full list of resources:

 Master/Slave Set: myoptClone01 [myopt_data01]
     Masters: [ pcmk01-cr ]
     Slaves: [ pcmk02-cr ]
 myopt_fs01     (ocf::heartbeat:Filesystem):    Started pcmk01-cr
 myopt_VIP01    (ocf::heartbeat:IPaddr2):       Started pcmk01-cr
 ServicesResource        (ocf::heartbeat:RADviewServices):       Stopped

Failed Actions:
* ServicesResource_monitor_120000 on pcmk02-cr **'unknown error'** (1): call=141, status=complete, exitreason='none',
    last-rc-change='Mon Jan 30 10:19:36 2017', queued=0ms, exec=142ms

Есть ли способ вставить мое собственное сообщение об ошибке вместо этого сообщения "неизвестная ошибка"???


person Lidor Aviman    schedule 30.01.2017    source источник
comment
Похоже, что на большинство вопросов, которые вы задаете в стеке, вы получаете ответы, но вы не принимаете ответы... люди могут перестать отвечать. Просто напоминание пометить ответы; делает Stack лучше;)   -  person Matt Kereczman    schedule 19.05.2017


Ответы (1)


Я не верю, что в выводе crm_mon или pcs status можно получить более наглядную ошибку. Однако ошибки в этих выходных данных ставят отметку времени сбоя. В вашем пользовательском агенте ресурсов вы можете выводить все, что угодно, в журналы во время ошибок. Затем вы можете проверить журналы вокруг временной метки, показанной в выводе pcs status, чтобы получить более точную информацию о сбое.

person Dok    schedule 30.01.2017