Я использую искру в scala для создания универсального приложения для распараллеливания http-вызовов, и меня беспокоит, можно ли будет выполнить действие saveToCassandra на основе содержимого RDD, поскольку ответы должны попадать в разные таблицы.
Чтобы внести больше ясности,
val queries: List[Query] = List(Query("google", "fish"), Query("yahoo", "chicken"))
val inputRDD = sc.parallelize(queries)
куда
case class Query(dataSource: String, query: String)
Затем каждый запрос сопоставляется со списком кортежей, которые нужно сохранить в cassandra, но в зависимости от источника данных в запросе данные для google должны попасть в таблицу cassandra для google, а для yahoo — в свою собственную таблицу.
ТИА