Я разрабатываю искровое приложение с использованием SPARK sql, одна из моих задач - выбрать значение из двух таблиц и вставить его в пустую таблицу, что является моим результатом. но для этого я экспериментирую с искрой для создания пустой таблицы, я создал пустой фрейм данных, но не могу зарегистрировать его как таблицу, вот моя ситуация, теперь код
from pyspark import SQLContext
from pyspark.sql.types import StructType,StructField,StringType,DateType,IntegerType
sqlc=SQLContext(sc)
schema= StructType([StructField("Name",StringType(),False),StructField("AGE",IntegerType(),False),StructField("DATE",DateType(),False)])
dataframe=sqlc.createDataFrame([],schema)
dataframe.show()
он показывает кадр данных, но я не уверен, является ли он регистром или нет, потому что нет значения
dataframe.registerTempTable("Exp")
experiment=sqlc.sql("SELECT * FROM Exp")
experiment.show()
Я думаю, что делаю здесь ошибку, поэтому для этой проблемы я хочу вставить какое-то значение для тестирования, но я не могу этого сделать. Я новичок в искре, поэтому не знаю, как решить эту ситуацию. я просмотрел некоторые форумы, я видел, как какой-то пользователь форума упомянул о методе parallelize() для создания таблицы, но я не совсем понял, как он работает. Обязательно ли использовать контекст куста для целей работы? мои требования выполняют эту работу без контекста улья. Пожалуйста, направь меня