У меня есть несколько таких показателей:
restarts{service="foo-1"}
restarts{service="foo-2"}
restarts{service="bar-1"}
restarts{service="bar-2"}
restarts{service="bar-3"}
Я пытаюсь использовать Alertmanager для запуска предупреждения, когда количество перезапусков всех экземпляров службы превышает пороговое значение.
Мне приходит в голову создать правило для каждого foo
и bar
отдельно, используя такой запрос:
sum(restarts{service=~"bar-.*"}) > 10
Но моих сервисов слишком много, чтобы написать правило для каждого из них.
Есть ли способ найти перезапуски каждой службы в одном запросе?