Я разрабатываю архитектуру, в которой все микросервисы сгруппированы. Например: 5 веб-серверов, 1 кластерный db, 1 кластерная система очереди, 8 кластеризованных рабочих (например, отправка электронной почты, отправка sms, ...), которые потребляют из очереди (задачи отправляются веб-сервером)
Мне интересно, как лучше всего определить, что каждый «кластер микросервисов» исправен, и как «быстро дать сбой» всей службе в таком случае, когда одна из микрослужб недоступна.
Вся служба находится за прокси-сервером nginx for ha - должен ли это быть nginx, который все отслеживает и дает сбой? Как я могу проверить работоспособность всех микросервисов?