Я пытаюсь использовать библиотеку графических кадров в Apache Zeppelin с интерпретатором Spark (pyspark), однако я продолжаю получать сообщение об ошибке: ModuleNotFoundError: No module named 'graphframes'
всякий раз, когда я пытаюсь импортировать модуль графических кадров с помощью from graphframes import *
.
Я пытался добавить директиву --packages 'graphframes:graphframes:0.7.0-spark2.4-s_2.11'
в файл zeppelin-env.sh, пробовал использовать функцию z.load('graphframes:graphframes:0.7.0-spark2.4-s_2.11')
и пробовал добавлять графические кадры в качестве зависимости в настройках интерпретатора, однако ни одна из этих попыток не сработала.
Я также попытался добавить искровой репозиторий в Zeppelin, а затем добавить координаты maven для графических фреймов в интерпретатор на цеппелине в разделе зависимостей. Однако и это не сработало.
Я использую spark версии 2.4 со scala 2.11 на zeppelin 0.8.1, размещенном в кластере EMR.
Я могу использовать графические кадры из терминала с помощью pyspark и директивы --packages, упомянутой выше, так что это похоже на проблему, связанную с цеппелином.
Я в тупике относительно того, что я мог бы сделать дальше. Любые идеи о том, как я могу заставить графические кадры работать на цеппелине?