У меня есть сценарий, в котором у меня есть некоторый набор файлов avro в HDFS. И мне нужно сгенерировать файлы схемы Avro для этих файлов данных AVRO в HDFS. Я пытался исследовать с помощью Spark (https://github.com/databricks/spark-avro/blob/master/src/main/scala/com/databricks/spark/avro/SchemaConverters.scala).
Есть ли что-то другое, кроме переноса файла данных AVRO на локальный сервер и выполнения HDFS PUT .
Любые предложения приветствуются. Спасибо!