Я столкнулся с ошибкой ниже при выполнении искрового действия через рабочий процесс oozie в кластере EMR 5.14:
pyspark.sql.utils.IllegalArgumentException: u «Ошибка при создании экземпляра 'org.apache.spark.sql.hive.HiveExternalCatalog'» Мой сценарий Pyspark работает нормально, когда выполняется как обычное искровое задание, но не выполняется выполняется через программу Oozie Pyspark: -
spark = SparkSession.builder.appName("PysparkTest").config("hive.support.quoted.identifiers", "none").enableHiveSupport().getOrCreate()
sc = SparkContext.getOrCreate();
sqlContext = HiveContext(sc)
sqlContext.sql("show databases").show()
Я создал workflow.xml и job.properties со ссылкой на ССЫЛКА.
Я скопировал весь файл конфигурации, связанный с Spark и Hive, в один и тот же каталог ($ SPARK_CONF_DIR /). Hive также настроен на использование MySQL в качестве хранилища метаданных.
Будет здорово, если вы поможете мне разобраться в проблеме, с которой я столкнулся при запуске этой программы Pyspark в виде файла jar в действии Oozie spark.