Создание политик предупреждений в отчетах об ошибках в Stackdriver

У меня есть требование создать политики предупреждений, когда есть 30 исключений тайм-аута подключения. В настоящее время мы генерируем исключение, когда есть тайм-аут соединения во время вызова веб-службы (потребляющие успокаивающие веб-службы), поэтому я хочу получать предупреждения, когда есть 30 тайм-аутов соединения исключения. Есть ли способ создать такие политики в Stakdriver. В настоящее время мы используем java8, весеннюю загрузку, движок google kubernetes, ведение журнала stackdriver. Я создал метрику под названием SAX-Exception. Когда я пытаюсь создать политики предупреждений stackdriver для этой метрики, я не вижу возможности агрегировать количество исключений за период времени.

                         This below image shows how the metrics is defined

введите здесь описание изображения

На изображениях ниже показано, как определяются политики предупреждений  введите описание изображения здесь < img src = "https://i.stack.imgur.com/kciFm.png" alt = "введите описание изображения здесь">  введите описание изображения здесь  введите описание изображения  здесь




Ответы (1)


Для этого ответа я предполагаю, что ваши ошибки подключения регистрируются в Stackdriver Logging с достаточной детализацией, которая может быть проанализирована Stackdriver.

Ваше программное обеспечение, генерирующее исключение, должно записывать это с помощью Stackdriver Logging, если вы хотите использовать Stackdriver Alerting. Добавить код ведения журнала Stackdriver очень просто практически на любом языке, включая Java.

Клиентские библиотеки журналов Stackdriver (Java).

Предполагая, что у вас есть журналы Stackdriver Logging с желаемой информацией о событиях:

  • Перейдите в Stackdriver Logging.
  • Создайте метрику на основе желаемой ошибки на основе содержимого записей журнала.

Документация: ссылка.

Создав метрику, вы можете создать оповещение на основе этой метрики. Вы можете агрегировать по количеству событий за период времени. В вашем случае 30 событий за одну минуту (или все, что вам нужно в качестве индикатора отказа).

Документация: ссылка.

person John Hanley    schedule 01.05.2019
comment
Спасибо, что нашли время ответить на мой пост. Я не вижу никакой опции на панели предупреждений драйвера стека для агрегирования событий за определенный период времени. Я обновил свой вопрос скриншотами. Пожалуйста, дайте мне знать, в чем я ошибаюсь - person Sid; 07.05.2019
comment
Ваш скриншот показывает это. Посмотрите на Advanced Aggregation - ›Alignment period. - person John Hanley; 07.05.2019
comment
Я обновил свой пост новым снимком экрана. Как вы можете видеть, я установил частоту событий на 30 отсчетов и сгенерировал 30 исключений в течение 15 минут. Я не получал никаких предупреждений. Пожалуйста, позвольте мне, где я ошибаюсь. - person Sid; 07.05.2019
comment
Не заменяйте части своего вопроса, просто добавьте к нему. Иначе никто не поймет, как решается ваш вопрос. Как настроено оповещение? Покажите, как определяется метрика. Покажите, как определяется предупреждение. - person John Hanley; 08.05.2019
comment
Я обновился. Не могли бы вы увидеть мой пост, достаточно ли в нем информации. - person Sid; 08.05.2019
comment
Ваши скриншоты соответствуют. Сообщайте о проблемах в том виде, в каком они существуют, а не в разных состояниях во время отладки. Ваш порог составляет более 30 за 15 минут. Уделите время чтению документации. Затем правильно настройте метрику и предупреждение. - person John Hanley; 09.05.2019