Перераспределить задачи dask среди кластера

Я злоупотребляю dask как планировщиком задач для длительных задач с map (, pure = False). Поэтому меня не интересует граф dask, я просто использую dark как способ распространения команд unix.

Допустим, у вас есть 1000 задач, и они работают в течение недели в кластере из 30 рабочих. Я заметил, что если рабочий выходит из строя, его задачи перераспределяются между оставшимися работниками.

Иногда я могу освободить ресурсы из других симуляций и добавить новых рабочих в кластер рабочего стола. Однако этим рабочим тогда назначено 0 задач, и они простаивают. Они получают новые задачи только в том случае, если один из старых рабочих выходит из строя, тогда задачи перераспределяются.

Итак, мой вопрос: «Могу ли я вручную перераспределить и перетасовать задачи в кластере dask»?


person MaxBenChrist    schedule 06.02.2018    source источник
comment
конечно, вы спрашиваете о задачах, которые еще не начались, не так ли?   -  person mdurant    schedule 06.02.2018


Ответы (1)


Планировщик уже должен балансировать старые задачи с новыми рабочими. Информация о нашей политике в отношении кражи работы находится здесь:

http://distributed.readthedocs.io/en/latest/work-stealing.html

Поэтому я с удивлением узнал, что задачи не перераспределяются автоматически. Если вы можете создать mcve для воспроизведения проблемы, мне бы хотелось взглянуть на него.

person MRocklin    schedule 06.02.2018
comment
Извините за поздний ответ, я добавил минимальный пример в github.com/dask/dask/issues/ 3264 - person MaxBenChrist; 09.03.2018