У меня есть тестовая машина с довольно низкой конфигурацией для моих конвейеров данных, разработанных в Spark. Я буду использовать только один экземпляр AWS t2.large, в котором всего 2 ЦП и 8 ГБ ОЗУ.
Мне нужно запустить 2 искровых потоковых задания, а также оставить немного памяти и мощности ЦП для периодического тестирования пакетных заданий.
Итак, у меня есть мастер и один рабочий, которые находятся на одной машине.
У меня есть несколько общих вопросов: 1) Сколько экзекьюторов может работать на одного воркера? Я знаю, что по умолчанию он один, но есть ли смысл его менять?
2) Может ли один исполнитель выполнять несколько приложений, или один исполнитель предназначен только для одного приложения?
3) Есть ли способ заставить это работать, чтобы установить память, которую приложение может использовать в файле конфигурации, или когда я создаю искровой контекст?
Спасибо