Я работаю Spark v1.6. У меня есть следующие два кадра данных, и я хочу преобразовать нуль в 0 в моем левом внешнем соединении ResultSet. Какие-либо предложения?
кадры данных
val x: Array[Int] = Array(1,2,3)
val df_sample_x = sc.parallelize(x).toDF("x")
val y: Array[Int] = Array(3,4,5)
val df_sample_y = sc.parallelize(y).toDF("y")
Левое внешнее соединение
val df_sample_join = df_sample_x
.join(df_sample_y,df_sample_x("x") === df_sample_y("y"),"left_outer")
Набор результатов
scala> df_sample_join.show
x | y
--------
1 | null
2 | null
3 | 3
But I want the resultset to be displayed as.
-----------------------------------------------
scala> df_sample_join.show
x | y
--------
1 | 0
2 | 0
3 | 3