Доброе утро, ребята, я писал небольшой скрипт для управления данными в R, но я не понимаю, почему, когда я импортирую огромный файл csv (3,5 ГБ) в R, он не работает. Чтобы быстро решить эту проблему, я решил использовать pandas
с reticulate
.
#Package from python
pd<-import("pandas", as="pd")
#leggo il file csv con pandas
pd$read_csv("C:\\Users\\Befrancesco\\Desktop\\X_dataset\\x_file_name.csv, error_bad_lines= FALSE, encoding = "utf-8" )
R возвращает мне этот тип ошибки:
Error in py_call_impl(callable, dots$args, dots$keywords) :
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xf6 in position 105: invalid start byte
Где я ошибаюсь?
Заранее спасибо за ваш ответ.
Франческо
error_bad_lines
, но здесь это не помогает. Мог ли вашencoding
быть здесь чем-то другим? Попробуйте этот ответ и ответ ниже: stackoverflow.com/questions/18171739/ - person meenaparam   schedule 23.01.2020