Вопросы по теме 'prometheus-alertmanager'
Как я могу добавить оповещения в Prometheus + AlertManager к определенным именам вакансий Prometheus?
Я запускаю экземпляр Prometheus для нескольких команд, и я хотел бы иметь возможность добавлять оповещения для серверов, которыми управляют разные команды.
Пример может прояснить это намного лучше, чем я могу объяснить:
Скажем, Team-A хочет...
582 просмотров
schedule
29.04.2024
Пользовательский приемник Prometheus alertmanager
В настоящее время я пытаюсь настроить Prometheus и Alertmanager, проблема, к которой я пришел и еще не нашла решения, заключается в том, что я хочу, чтобы предупреждение отправлялось в наше настраиваемое приложение с авторизацией oauth2.
Есть ли...
1616 просмотров
schedule
17.07.2022
Prometheus kube_pod_container_status_waiting_reason не захватывает под CrashLoopBackOff причина
По определению, kube_pod_container_status_waiting_reason должен фиксировать причины для модуля в состоянии ожидания.
В моем кластере kubernetes есть несколько модулей, которые находятся в CrashLoopBackOff, но я не вижу этой причины,...
1408 просмотров
schedule
10.04.2023
Мониторинг и оповещение об аномалии прометея по количеству показателей
У нас есть несколько серверов Prometheus, каждый из которых контролирует свой регион (фактически 2 на регион), есть также серверы thanos, которые могут запрашивать несколько регионов, и мы также используем alertmanager для оповещения.
В последнее...
1913 просмотров
schedule
05.12.2022
Настроить оповещения alertmanager в prometheus helm chart values.yaml
Я хочу подключить prometheus к alertmanager, и у меня возникла проблема с настройкой конечных точек оповещения alertmanager в диаграмме значений values.yaml helm. Я пробовал это раньше с docker-compose, и он работал, но с диаграммами руля все...
2468 просмотров
schedule
03.11.2022
Альтернатива конфигурационным файлам в Prometheus?
Я хочу внедрить систему мониторинга в небольшой организации. У меня есть опыт работы с Zabbix, но я рассматриваю Prometheus, поскольку кажется, что за ним стоит большое сообщество, и на сегодняшний день это в значительной степени стандарт...
752 просмотров
schedule
09.06.2024
Отключить оповещения прометея через 10 минут
У меня есть кластер kubernetes, и для мониторинга и оповещений я использую Prometheus. Диспетчер предупреждений Prometheus повторяет предупреждения, пока они не станут активными. Я хочу настроить свой диспетчер предупреждений на отправку...
1452 просмотров
schedule
09.11.2023
Определение общих предупреждений Prometheus с разными порогами предупреждений для каждой службы
Я определил несколько предупреждений с выражениями, которые выглядят следующим образом:
sum(rate(some_error_metric[1m])) BY (namespace,application) > 10
sum(rate(some_other_error_metric[1m])) BY (namespace,application) > 10
......
1866 просмотров
schedule
11.06.2023
Есть ли способ установить оповещение для нескольких метрик ENUM с похожим именем
Я пытаюсь обрабатывать несколько (около 500) показателей с похожими именами, например:
INSTANCE03{INSTANCE03="Dead"} == 1
INSTANCE05{INSTANCE05="Dead"} == 1
INSTANCE07{INSTANCE07="Dead"} == 1
Каждый из них указан как Enum, который показывает...
204 просмотров
schedule
19.01.2024
Использование метрики в правой части запроса prometheus
Я использую prometheus и grafana для мониторинга некоторых серверов. Одна из представленных мною метрик называется recent_tables , которая содержит количество ресурсов, которые были записаны в таблицы sql за последние 15 минут (машины автоматически...
396 просмотров
schedule
28.06.2023
Правила тестирования AlertManager FAILED: yaml: unmarshal errors: строка 1: группы полей не найдены в типе main.unitTestFile
пожалуйста, помогите, я получил сообщение об ошибке при тестировании диспетчера предупреждений ниже
promtool check rules /etc/prometheus/alert.rules.yml
Checking /etc/prometheus/alert.rules.yml
SUCCESS: 3 rules found
promtool test rules...
2462 просмотров
schedule
31.12.2022
Федеративный прометей
Я хочу иметь интегрированный Prometheus с удаленным хранилищем (infxdb). Я новичок в Prometheus и мониторинге. Как лучше всего реализовать федеративный Прометей?
Нужны ли нам Prometheus, alertmanager, influenxdb и grafana в каждом центре...
231 просмотров
schedule
09.11.2023
Уникально ли поле отпечатка пальца в Alertmanager?
Я разрабатываю приборную панель, которая принимает все показания Alertmanager и обрабатывает их. Я искал уникальное поле в полезной нагрузке запроса, чтобы создать уникальный внешний идентификатор предупреждения в моей базе данных. Полезные данные...
898 просмотров
schedule
28.10.2022
Alertmanager: отправить запрос на публикацию по определенному URL-адресу при срабатывании предупреждения?
Я использую alert-manager с Prometheus. Можно ли отправить запрос на публикацию по определенному URL-адресу при срабатывании предупреждения? В настоящее время я отправляю оповещения по электронной почте. Я хочу, чтобы он ударил по определенному...
986 просмотров
schedule
25.05.2023
Определить отсутствие оповещения Прометей
У меня есть предупреждение для Prometheus, настроенное таким образом, что оно зависит от отсутствия значения для другого предупреждения:
- alert: Some_Alert
expr: |
round(some_expr) > 24
AND...
625 просмотров
schedule
04.04.2024
Использовать переменную внутри запроса Alertmanager Promql
У меня есть несколько таких показателей:
restarts{service="foo-1"}
restarts{service="foo-2"}
restarts{service="bar-1"}
restarts{service="bar-2"}
restarts{service="bar-3"}
Я пытаюсь использовать Alertmanager для запуска предупреждения, когда...
326 просмотров
schedule
04.12.2022
Заменить значение в динамическом списке словаря, загруженного из alertmanager yml?
Этот вопрос довольно специфичен, я успешно сделал то, что хочу, но он очень специфичен для моего варианта использования и, вероятно, уродлив для эксперта по Python, поэтому мне любопытно, может ли он быть более общим и/или умным.
Мне нужно...
62 просмотров
schedule
28.04.2023
Клиент Go prometheus получает другую задержку с клиентом prometheus Python
Я читаю коды измерения задержки , потому что я обнаружил, что измеренная задержка выше, чем сквозная задержка, измеренная кодами Python. Верно ли следующее использование InstrumentRoundTripperDuration ? Я не нашел подобных примеров в Интернете....
218 просмотров
schedule
31.07.2023
Оповещения Prometheus на основе непериодических показателей пакетных заданий
У меня есть CronJob, который запускается каждые 20 минут и собирает только активные сборки для многоотраслевых заданий Jenkins, продолжительность сборки которых превышает определенное значение, и публикует эти метрики с продолжительностью сборки в...
89 просмотров
schedule
24.07.2022
Попытка уведомления Alertmanager не удалась, повторная попытка позже имя пользователя и пароль не приняты
Я установил prometheus и alertmanager для уведомлений по электронной почте в свою учетную запись Gmail.
Но ошибка, связанная с тем, что данный пароль приложения google или gmail не принимается.
Я указал правильное имя пользователя, адрес...
347 просмотров
schedule
04.08.2023