Я импортирую данные из файла csv, где у меня есть столбцы Reading1 и Reading2, и сохраняю их в фреймворке pyspark. Моя цель - получить новое имя столбца Reading и его значение в виде массива, содержащего значения Reading1 и Reading2. Как мне добиться того же в pyspark.
+---+-----------+-----------+
| id| Reading A| Reading B|
+---+-----------------------+
|01 | 0.123 | 0.145 |
|02 | 0.546 | 0.756 |
+---+-----------+-----------+
Desired Output:
+---+------------------+
| id| Reading |
+---+------------------+
|01 | [0.123, 0.145] |
|02 | [0.546, 0.756 |
+---+------------------+-
array
илиstruct
. - person pault   schedule 22.09.2019