Я должен записать выходные данные фрейма данных искры в CSV-файл с разделителем "|^|". Я пытаюсь сделать так.
df.write.format("csv").option("delimiter", "\\|\\^\\|")
Но ошибка ниже
java.lang.IllegalArgumentException: неподдерживаемый специальный символ для разделителя: \|\^\|
Как добавить кодировку UTF-8-BOM в выходной файл, по умолчанию это UTF-8?
В java, если я добавлю «\ uFEFF» в начало файла, кодировка файла изменится на UTF-8-BOM. Теперь, как я могу добавить этот символ в spark csv?
Также, если я пойду с нижеприведенным подходом df.rdd.map(x=>x.mkString("|^|")).saveAsTextFile("dir path to store")
Как бы я разделил свои данные на основе столбца в фрейме данных?
|^|
? spark-csv поддерживает только один символ. Почему бы вам не использовать стандартный csv или использовать только один символ? а затем, когда вы читаете файл, снова используйте этот разделитель. Ты не можешь сделать так? - person Ramesh Maharjan   schedule 05.10.2017then all option i am getting as csv will not be available by default
что ты имеешь в виду? - person Ramesh Maharjan   schedule 05.10.2017