Публикации по теме 'fault-tolerance'


Erlang-For-Beginners E101: (пифагорейские триплеты, перестановки с использованием списков)
Пифагоровы тройки — это наборы целых чисел {A,B,C}, такие что A**2 + B**2 = C**2. -module(pythagorean_triplets). -compile(export_all). pythagorean(N) -> [{S1, S2, S3} || S1 <- lists:seq(1, N), %........1 S2 <- lists:seq(1, N), %........2 S3 <- lists:seq(1, N), %.........3 (S1 + S2 + S3) =< N, %..........4 S1 =< S2, %..........5 S1 * S1 + S2 * S2 =:= S3 * S3]. %........6..

Полли повторяет попытки и F #
Недавно я взаимодействовал с библиотекой обработки временных ошибок Polly на C#. Но только в контексте вызова API (микросервисов в нашей экосистеме). Совсем недавно я понял, что его можно использовать в интеграции RavenDB с одним из моих проектов F# — об этом в блоге. Вот моя реализация: создатьПолитику: int -> AsyncRetryPolicy executeCustom: CancellationToken -> (CancellationToken -> Task<'exception>) -> AsyncRetryPolicy -> Task<'exception>..

Автоматизированная отказоустойчивость с использованием схемы автоматического выключателя
В этом посте мы обсудим новую технику, называемую «автоматические выключатели», которую мы использовали, чтобы сделать наш сайт более отказоустойчивым. Автоматические выключатели - это решение проблемы быстрого обнаружения и исправления ситуации, когда внешняя зависимость начинает выходить из строя. Проблема На диаграмме ниже в общих чертах показано, как работает сайт Teachers Pay Teachers. Наши пользователи - преподаватели, просматривающие сайт в поисках ресурсов, которые они..

Erlang для начинающих E101
Начнем с самого начала. Первое, что вам нужно сделать, это установить Erlang. Существует полное руководство по установке , которое охватывает все конфигурации. Находясь на сайте, обязательно добавьте документы в закладки. Вы будете часто обращаться к ним, когда будете учиться! Далее вам понадобится текстовый редактор. Если у вас еще нет любимого редактора, рекомендую Visual Studio Code . По состоянию на начало 2018 года VS code является проектом номер один на Github с точки..

3 способа свести к минимуму причину неисправности, вызванную человеческими ошибками
№3. Быстрое восстановление Мы создаем, проектируем и контролируем программные системы. Даже когда у нас есть хорошее намерение заставить все работать, люди ненадежны. Неисправности обычно возникают, когда что-то не работает, как указано в спецификации. Большинство дефектов нельзя предотвратить, но можно избежать. Ключ к устранению неисправностей в системе - это то, какие действия вы предпринимаете, чтобы избежать и быстро разрешить такие ситуации. Существует множество статей о..

Вопросы по теме 'fault-tolerance'

Что случилось с атрибутом [OptionalField]?
Насколько я понимаю, мне нужно украсить новый член в более новой версии моего класса атрибутом [OptionalField] при десериализации старой версии моего класса, в которой отсутствует этот новый член. Однако приведенный ниже код не создает исключений,...
3778 просмотров
schedule 28.02.2023

Мне обязательно нужно минимум 3 узла/сервера для кластера Cassandra или будет достаточно 2?
Конечно, можно запустить кластер с одним узлом, но мне нужен некоторый уровень отказоустойчивости. В настоящее время я могу позволить себе арендовать два сервера (8 ГБ ОЗУ, частная VLAN @ 1GigE), но не 3. Насколько я понимаю, 3 узла — это...
13594 просмотров
schedule 26.01.2023

NServiceBus подходит для распределения нагрузки периодических задач
Подойдет ли NServiceBus или эквивалентный ESB для приложения, которое имеет кучу различных фоновых задач типа обслуживания? Например: Сканирование баз данных на наличие определенных слов в пользовательском контенте Обновление таблиц базы...
368 просмотров

отказоустойчивость в MPICH / OpenMPI
У меня два вопроса- Q1 . Есть ли более эффективный способ справиться с ошибочной ситуацией в MPI, кроме контрольной точки / отката? Я вижу, что если узел "умирает", программа резко останавливается .. Есть ли способ продолжить выполнение после...
2486 просмотров
schedule 02.12.2023

Создание отказоустойчивой системы - Использовать файл данных для перезагрузки сохраненных данных?
РЕДАКТИРОВАТЬ - Язык реализации - Java. Я хочу сделать простую отказоустойчивую систему. Объект A - этот объект содержит логику принятия решения для системы. Объект B - этот объект будет использоваться для контроля отказоустойчивости...
183 просмотров
schedule 03.03.2023

Что происходит в Erlang, если квитанция о вручении не приходит?
Я случайно прочитал диссертацию Джо Армстронга и не очень хорошо разбирался в Erlang. Интересно, что будет, если квитанция о доставке какого-то сообщения так и не придет. Что делает отправляющий актер? Он отправляет сообщение в другой раз? Это...
97 просмотров
schedule 13.05.2023

Настраиваемая отказоустойчивость OpenMPI для слабосвязанных параллельных процессов
Я выполняю вычисления на платформе Amazon EC3, используя несколько машин, подключенных через OpenMPI. Для снижения стоимости вычислений используются спотовые инстансы, которые автоматически отключаются, когда стоимость машины превышает установленную...
219 просмотров

Отказоустойчивость Storm: Nimbus переназначает работника на другую машину?
Как заставить шторм-нимб перезапускать воркера на той же машине? Чтобы проверить отказоустойчивость, я делаю kill -9 для рабочего процесса, ожидая, что он будет перезапущен на той же машине, но на одной из машин nimbus запускает воркера на другой...
908 просмотров

Сервисный стек Redis переподключается после перезагрузки сервера Redis
Мы используем BlockingDequeue RedisClient сервисного стека для сохранения некоторых данных до тех пор, пока они не будут обработаны. Код вызова выглядит так using (var client = ClientPool.GetClient()) return...
364 просмотров
schedule 10.07.2023

Akka OneForOneStrategy не работает
У меня есть следующий код: class A extends Actor with ActorLogging { override val supervisorStrategy = OneForOneStrategy(maxNrOfRetries = 2) { case _ => log.info("An actor has been killed"); Restart } val b =...
1644 просмотров
schedule 23.07.2023

Единая отказоустойчивая машина с Amazon AWS
Для конкретной службы мне нужно запустить единственный экземпляр EC2 отказоустойчивым способом. Только в случае ошибок . Я хочу, чтобы "основная" машина была отключена, а трафик должен быть перенаправлен на "вторичную" машину в течение...
250 просмотров

Лучший способ работать с наборами реплик в MongoDB, используя только 2 сервера
Я собираюсь использовать решение с двумя серверами для своей производственной среды, в которой используется MongoDB. Если я правильно понимаю, у меня может быть 1 набор реплик с 2 узлами, по одному на каждом сервере. Теперь, чтобы...
788 просмотров
schedule 08.07.2023

Как реализовать постоянную/отказоустойчивую репликацию с помощью PouchDB?
Функции replicate() PouchDB не являются отказоустойчивыми и прекратят репликацию, если вы потеряете подключение к Интернету или столкнетесь с некоторыми сбоями в сети. Это довольно неприятно, когда вам нужно, чтобы ваше приложение реплицировало...
158 просмотров

Шаблоны выполнения Hystrix
Я пытаюсь понять Hystrix и после прочтения их документов , все еще есть вопрос о его шаблонах использования. Во-первых, я не понимаю вариант использования для когда использовать их асинхронное выполнение по сравнению с их реактивным...
4159 просмотров

Кэширование запросов Hystrix на примере
Я пытаюсь понять, как работает кэширование запросов Hystrix , но я не слежу за вики или сквозные примеры, которые они предоставляют в своих документах. По сути, у меня есть следующий подкласс HystrixCommand : public class GetFizzCommand...
7357 просмотров
schedule 02.02.2023

Отказоустойчивость Google+ Auth (код уже погашен)
В настоящее время я внедряю аутентификацию Google+ на Android с автономным доступом. Это влечет за собой запрос одноразового кода авторизации, который можно отправить на сервер и обменять на токен обновления. Все идет нормально. Однако...
2719 просмотров

Как определить иерархию актера/супервайзера Akka?
Я новичок в Akka (Java lib, v2.3.9). Я пытаюсь следовать рекомендациям по иерархии супервизоров , но поскольку это мое первое приложение Akka, я где-то сталкиваюсь с ментальным барьером. В моем первом приложении Akka (на самом деле это...
936 просмотров

Проектирование иерархии супервизора Akka
Обратите внимание: я разработчик Java и практически не знаю Scala (к сожалению). Я бы попросил, чтобы любые примеры кода, представленные в ответе, использовали Java API Akka. Я новичок в Akka и актерах и пытаюсь настроить довольно простую...
162 просмотров

Смягчение ахиллова сухожилия Hadoop
Я только что прочитал это руководство по Hadoop , в котором говорится, что у Hadoop есть ахиллово сухожилие ( единая точка отказа) в JobTracker : JobTracker — это единственная точка отказа для службы Hadoop MapReduce, что означает, что если...
96 просмотров
schedule 07.02.2024

Выживет ли zookeeper после падения одного узла в кластере из трех узлов?
Я видел, аналогичный вопрос был в экземплярах Zoopekeeper в Kafka . Но вопрос остался без ответа. Итак, моя расширенная версия вопроса (с более подробной информацией) Среда: существует 3 узла бизнес-приложения. Каждое приложение...
1084 просмотров