Как связать два столбца данных в sparkR?

Как связать два столбца фрейма данных в SparkR spark 1.4

ТИА, Арун


person Arun Gunalan    schedule 23.07.2015    source источник
comment
Не могли бы вы уточнить. Каков пример ввода и ожидаемого результата?   -  person zero323    schedule 28.07.2015
comment
@zero323 так же, как мы делаем при программировании на R с помощью cbind(). см. пример ссылки   -  person Arun Gunalan    schedule 11.08.2015
comment
Поддерживается ли это в sparkR 1.5?   -  person Kumar Deepak    schedule 25.09.2015


Ответы (1)


Это невозможно сделать. Вот вопрос по искре (1.3) в scala. Единственный способ сделать это - иметь какую-то строку row.numbering, потому что тогда вы можете присоединиться к row.number. Почему? Поскольку вы можете только присоединять таблицы или добавлять столбцы на основе других уже существующих столбцов.

data1 <- createDataFrame(sqlContext, data.frame(a=c(1,2,3)))
data2 <- createDataFrame(sqlContext, data.frame(b=c(2,3,4)))

затем

withColumn(data1,"b",data1$a + 1)

допускается, но

withColumn(data1,"b",data2$b)

не является. С того момента, как Spark разрезает ваш DataFrame на блоки для его хранения, он понятия не имеет, как их связать (он не имеет представления о последовательности строк), только когда у вас есть row.numbers.

person Wannes Rosiers    schedule 23.07.2015