Каждый раз, когда я пытаюсь запустить следующую команду Scala
val dataRDD = sc.textFile("hdfs://quickstart.cloudera:8020/user/cloudera/data/data.txt")
dataRDD.collect().foreach(println)
//or
dataRDD.count()
Я получаю следующее исключение -
exitCodeException exitCode=1: File "/etc/hadoop/conf.cloudera.yarn/topology.py", line 43 print default_rack^
SyntaxError: Missing parentheses in call to 'print'
-Я использую Spark 1.6.0 на виртуальной машине Cloudera. Кто-нибудь еще сталкивался с такой проблемой? Что может быть причиной? Я понимаю, что это связано с файлом «topology.py», который пытается печатать без «(», что требуется на python 3. Но почему этот скрипт выполняется, когда я не запускаю python / pyspark. Это происходит только через виртуальную машину Cloudera, когда я запускаю вне виртуальной машины с некоторыми другими демонстрационными данными, команды работают!