Вопросы по теме 'prometheus-alertmanager'

Как я могу добавить оповещения в Prometheus + AlertManager к определенным именам вакансий Prometheus?
Я запускаю экземпляр Prometheus для нескольких команд, и я хотел бы иметь возможность добавлять оповещения для серверов, которыми управляют разные команды. Пример может прояснить это намного лучше, чем я могу объяснить: Скажем, Team-A хочет...
582 просмотров
schedule 29.04.2024

Пользовательский приемник Prometheus alertmanager
В настоящее время я пытаюсь настроить Prometheus и Alertmanager, проблема, к которой я пришел и еще не нашла решения, заключается в том, что я хочу, чтобы предупреждение отправлялось в наше настраиваемое приложение с авторизацией oauth2. Есть ли...
1616 просмотров

Prometheus kube_pod_container_status_waiting_reason не захватывает под CrashLoopBackOff причина
По определению, kube_pod_container_status_waiting_reason должен фиксировать причины для модуля в состоянии ожидания. В моем кластере kubernetes есть несколько модулей, которые находятся в CrashLoopBackOff, но я не вижу этой причины,...
1408 просмотров

Мониторинг и оповещение об аномалии прометея по количеству показателей
У нас есть несколько серверов Prometheus, каждый из которых контролирует свой регион (фактически 2 на регион), есть также серверы thanos, которые могут запрашивать несколько регионов, и мы также используем alertmanager для оповещения. В последнее...
1913 просмотров

Настроить оповещения alertmanager в prometheus helm chart values.yaml
Я хочу подключить prometheus к alertmanager, и у меня возникла проблема с настройкой конечных точек оповещения alertmanager в диаграмме значений values.yaml helm. Я пробовал это раньше с docker-compose, и он работал, но с диаграммами руля все...
2468 просмотров

Альтернатива конфигурационным файлам в Prometheus?
Я хочу внедрить систему мониторинга в небольшой организации. У меня есть опыт работы с Zabbix, но я рассматриваю Prometheus, поскольку кажется, что за ним стоит большое сообщество, и на сегодняшний день это в значительной степени стандарт...
752 просмотров
schedule 09.06.2024

Отключить оповещения прометея через 10 минут
У меня есть кластер kubernetes, и для мониторинга и оповещений я использую Prometheus. Диспетчер предупреждений Prometheus повторяет предупреждения, пока они не станут активными. Я хочу настроить свой диспетчер предупреждений на отправку...
1452 просмотров
schedule 09.11.2023

Определение общих предупреждений Prometheus с разными порогами предупреждений для каждой службы
Я определил несколько предупреждений с выражениями, которые выглядят следующим образом: sum(rate(some_error_metric[1m])) BY (namespace,application) > 10 sum(rate(some_other_error_metric[1m])) BY (namespace,application) > 10 ......
1866 просмотров
schedule 11.06.2023

Есть ли способ установить оповещение для нескольких метрик ENUM с похожим именем
Я пытаюсь обрабатывать несколько (около 500) показателей с похожими именами, например: INSTANCE03{INSTANCE03="Dead"} == 1 INSTANCE05{INSTANCE05="Dead"} == 1 INSTANCE07{INSTANCE07="Dead"} == 1 Каждый из них указан как Enum, который показывает...
204 просмотров
schedule 19.01.2024

Использование метрики в правой части запроса prometheus
Я использую prometheus и grafana для мониторинга некоторых серверов. Одна из представленных мною метрик называется recent_tables , которая содержит количество ресурсов, которые были записаны в таблицы sql за последние 15 минут (машины автоматически...
396 просмотров

Правила тестирования AlertManager FAILED: yaml: unmarshal errors: строка 1: группы полей не найдены в типе main.unitTestFile
пожалуйста, помогите, я получил сообщение об ошибке при тестировании диспетчера предупреждений ниже promtool check rules /etc/prometheus/alert.rules.yml Checking /etc/prometheus/alert.rules.yml SUCCESS: 3 rules found promtool test rules...
2462 просмотров

Федеративный прометей
Я хочу иметь интегрированный Prometheus с удаленным хранилищем (infxdb). Я новичок в Prometheus и мониторинге. Как лучше всего реализовать федеративный Прометей? Нужны ли нам Prometheus, alertmanager, influenxdb и grafana в каждом центре...
231 просмотров

Уникально ли поле отпечатка пальца в Alertmanager?
Я разрабатываю приборную панель, которая принимает все показания Alertmanager и обрабатывает их. Я искал уникальное поле в полезной нагрузке запроса, чтобы создать уникальный внешний идентификатор предупреждения в моей базе данных. Полезные данные...
898 просмотров

Alertmanager: отправить запрос на публикацию по определенному URL-адресу при срабатывании предупреждения?
Я использую alert-manager с Prometheus. Можно ли отправить запрос на публикацию по определенному URL-адресу при срабатывании предупреждения? В настоящее время я отправляю оповещения по электронной почте. Я хочу, чтобы он ударил по определенному...
986 просмотров
schedule 25.05.2023

Определить отсутствие оповещения Прометей
У меня есть предупреждение для Prometheus, настроенное таким образом, что оно зависит от отсутствия значения для другого предупреждения: - alert: Some_Alert expr: | round(some_expr) > 24 AND...
625 просмотров

Использовать переменную внутри запроса Alertmanager Promql
У меня есть несколько таких показателей: restarts{service="foo-1"} restarts{service="foo-2"} restarts{service="bar-1"} restarts{service="bar-2"} restarts{service="bar-3"} Я пытаюсь использовать Alertmanager для запуска предупреждения, когда...
326 просмотров

Заменить значение в динамическом списке словаря, загруженного из alertmanager yml?
Этот вопрос довольно специфичен, я успешно сделал то, что хочу, но он очень специфичен для моего варианта использования и, вероятно, уродлив для эксперта по Python, поэтому мне любопытно, может ли он быть более общим и/или умным. Мне нужно...
62 просмотров

Клиент Go prometheus получает другую задержку с клиентом prometheus Python
Я читаю коды измерения задержки , потому что я обнаружил, что измеренная задержка выше, чем сквозная задержка, измеренная кодами Python. Верно ли следующее использование InstrumentRoundTripperDuration ? Я не нашел подобных примеров в Интернете....
218 просмотров

Оповещения Prometheus на основе непериодических показателей пакетных заданий
У меня есть CronJob, который запускается каждые 20 минут и собирает только активные сборки для многоотраслевых заданий Jenkins, продолжительность сборки которых превышает определенное значение, и публикует эти метрики с продолжительностью сборки в...
89 просмотров

Попытка уведомления Alertmanager не удалась, повторная попытка позже имя пользователя и пароль не приняты
Я установил prometheus и alertmanager для уведомлений по электронной почте в свою учетную запись Gmail. Но ошибка, связанная с тем, что данный пароль приложения google или gmail не принимается. Я указал правильное имя пользователя, адрес...
347 просмотров