Я пытаюсь обрабатывать несколько (около 500) показателей с похожими именами, например:
INSTANCE03{INSTANCE03="Dead"} == 1
INSTANCE05{INSTANCE05="Dead"} == 1
INSTANCE07{INSTANCE07="Dead"} == 1
Каждый из них указан как Enum, который показывает такой статус:
INSTANCE03{INSTANCE03="Dead"} == 1
INSTANCE03{INSTANCE03="Alive"} == 0
Есть ли способ сделать оповещение о переключении статуса с живого на мертвый для всех этих показателей в кратчайшие сроки? E. грамм. использовать регулярное выражение для значения __name__?
Оповещение работает, если я указываю по одному экземпляру метрики в строке, но это не лучший способ для такого количества метрик.
Ниже моего alert_rules.yml
groups:
- name: example
rules:
- alert: InstanceDown
expr: INSTANCE03{INSTANCE03="Dead",instance="127.0.0.1:8888",job="prometheus"} == 1
for: 15s
annotations:
summary: "Instance is down."
description: "Instance down for 15 seconds. Please check mentioned instance."