Я совершенно новичок в Apache Spark, и я пытаюсь создать два декартовых продукта RDD. В качестве примера у меня есть A и B, как:
A = {(a1,v1),(a2,v2),...}
B = {(b1,s1),(b2,s2),...}
Мне нужен новый RDD, например:
C = {((a1,v1),(b1,s1)), ((a1,v1),(b2,s2)), ...}
Любая идея, как я могу это сделать? Максимально просто :)
заранее спасибо
PS: я, наконец, сделал это так, как предложил @Amit Kumar:
cartesianProduct = A.cartesian(B)