Я отправляю скрипт Pyspark/SparkSQL, используя опцию spark-submit, и мне нужно передать переменные времени выполнения (имя базы данных) в скрипт
команда отправки искры:
spark-submit --conf database_parameter=my_database my_pyspark_script.py
скрипт pyspark
database_parameter = SparkContext.getConf().get("database_parameter")
DF = sqlContext.sql("SELECT count(*) FROM database_parameter.table_name")
Версия spark: 1.5.2
Версия Python: 2.7.5
Решение, которое я пытаюсь использовать, не работает. Ошибка: AttributeError: объект типа «SparkConf» не имеет атрибута «getConf».
Я ищу способ передать переменную времени выполнения при вызове скрипта через spark-submit и использовать эти переменные в скрипте.