Создание политик предупреждений в отчетах об ошибках в Stackdriver

У меня есть требование создать политики предупреждений, когда есть 30 исключений тайм-аута подключения. В настоящее время мы генерируем исключение, когда есть тайм-аут соединения во время вызова веб-службы (потребляющие успокаивающие веб-службы), поэтому я хочу получать предупреждения, когда есть 30 тайм-аутов соединения исключения. Есть ли способ создать такие политики в Stakdriver. В настоящее время мы используем java8, весеннюю загрузку, движок google kubernetes, ведение журнала stackdriver. Я создал метрику под названием SAX-Exception. Когда я пытаюсь создать политики предупреждений stackdriver для этой метрики, я не вижу возможности агрегировать количество исключений за период времени.

                         This below image shows how the metrics is defined

На изображениях ниже показано, как определяются политики предупреждений < img src = "https://i.stack.imgur.com/kciFm.png" alt = "введите описание изображения здесь">

Sid 30.04.2019 источник

Ответы (1)

arrow_upward
1
arrow_downward

Для этого ответа я предполагаю, что ваши ошибки подключения регистрируются в Stackdriver Logging с достаточной детализацией, которая может быть проанализирована Stackdriver.

Ваше программное обеспечение, генерирующее исключение, должно записывать это с помощью Stackdriver Logging, если вы хотите использовать Stackdriver Alerting. Добавить код ведения журнала Stackdriver очень просто практически на любом языке, включая Java.

Клиентские библиотеки журналов Stackdriver (Java).

Предполагая, что у вас есть журналы Stackdriver Logging с желаемой информацией о событиях:

Перейдите в Stackdriver Logging.
Создайте метрику на основе желаемой ошибки на основе содержимого записей журнала.

Документация: ссылка.

Создав метрику, вы можете создать оповещение на основе этой метрики. Вы можете агрегировать по количеству событий за период времени. В вашем случае 30 событий за одну минуту (или все, что вам нужно в качестве индикатора отказа).

Документация: ссылка.

John Hanley 01.05.2019

comment

Спасибо, что нашли время ответить на мой пост. Я не вижу никакой опции на панели предупреждений драйвера стека для агрегирования событий за определенный период времени. Я обновил свой вопрос скриншотами. Пожалуйста, дайте мне знать, в чем я ошибаюсь - Sid; 07.05.2019

comment

Ваш скриншот показывает это. Посмотрите на Advanced Aggregation - ›Alignment period. - John Hanley; 07.05.2019

comment

Я обновил свой пост новым снимком экрана. Как вы можете видеть, я установил частоту событий на 30 отсчетов и сгенерировал 30 исключений в течение 15 минут. Я не получал никаких предупреждений. Пожалуйста, позвольте мне, где я ошибаюсь. - Sid; 07.05.2019

comment

Не заменяйте части своего вопроса, просто добавьте к нему. Иначе никто не поймет, как решается ваш вопрос. Как настроено оповещение? Покажите, как определяется метрика. Покажите, как определяется предупреждение. - John Hanley; 08.05.2019

comment

Я обновился. Не могли бы вы увидеть мой пост, достаточно ли в нем информации. - Sid; 08.05.2019

comment

Ваши скриншоты соответствуют. Сообщайте о проблемах в том виде, в каком они существуют, а не в разных состояниях во время отладки. Ваш порог составляет более 30 за 15 минут. Уделите время чтению документации. Затем правильно настройте метрику и предупреждение. - John Hanley; 09.05.2019

Создание политик предупреждений в отчетах об ошибках в Stackdriver

Ответы (1)

Вопросы по теме