Я пытаюсь прочитать файл avro в записной книжке Jupyter с помощью pyspark. Когда я читаю файл, я получаю сообщение об ошибке.
Я загрузил spark-avro_2.11: 4.0.0.jar, я не уверен, где в моем коде я должен вставлять пакет avro. Любые предложения были бы замечательными.
Это пример кода, который я использую для чтения файла avro.
df_avro_example = sqlContext.read.format("com.databricks.spark.avro").load("example_file.avro")
Это ошибка, которую я получаю
AnalysisException: «Не удалось найти источник данных: com.databricks.spark.avro. Пожалуйста, найдите пакет Avro по адресу http://spark.apache.org/third-party-projects.html; '