Я использую pyspark 1.3.1, мне нужно создать уникальный идентификатор/номер для каждой строки в кадре данных.
Поскольку оконные функции недоступны в версии Pyspark: 1.3.1, я не могу использовать функцию rownumber.
Как я могу ввести номер строки без функции rownumber и без преобразования кадра данных в RDD?
zipWithIndex()
? - person Zahiro Mor   schedule 11.04.2016