Я создал и сохранил запросы с использованием HIVE и PIG, которые я хотел бы запланировать для выполнения на еженедельной основе. Сценарии создают файлы S3 и обновляют DynamoTables. Что можно использовать для создания кластера AmazonEMR для автоматического запуска этих сценариев по расписанию.
Я думал об AWS Data Pipeline, но, похоже, он требует создания узлов данных, и я не думаю, что это необходимо для моих целей.