Ливи предоставляет REST API двумя способами: сессионным и пакетным. В вашем случае, поскольку мы предполагаем, что вы не используете сеанс, вы отправляете с использованием пакетов. Вы можете опубликовать свою партию, используя команду curl:
curl http://livy-server-IP:8998/batches
После того, как вы отправите задание, вы получите взамен идентификатор партии. Затем вы можете завить с помощью команды:
curl http://livy-server-IP:8998/batches/ {batchId} / бревно
Вы можете найти документацию по адресу: https://livy.incubator.apache.org/docs/latest/rest-api.html
Если вы хотите избежать описанных выше шагов, вы можете использовать готовый AMI (а именно, LightningFLow) из AWS Marketplace, который предоставляет Airflow настраиваемый оператор Livy. Оператор Livy отправляет и отслеживает статус задания каждые 30 секунд (настраивается), а также предоставляет журналы искр в конце задания искры в журналах пользовательского интерфейса Airflow.
Примечание. LightningFlow предварительно интегрирован со всеми необходимыми библиотеками, Livy, пользовательскими операторами и локальным кластером Spark.
Ссылка для AWS Marketplace: https://aws.amazon.com/marketplace/pp/Lightning-Analytics-Inc-LightningFlow-Integrated-o/B084BSD66V
Это позволит вам просматривать консолидированные журналы в одном месте, вместо того, чтобы переключаться между журналами Airflow и EMR / Spark (Ambari / Resource Manager).
person
Lightning-Analytics
schedule
14.02.2020