Как лучше всего загружать большие файлы в RStudio с помощью AMI Луи Аслетта на EC2

Я хотел бы загрузить огромный файл (50 ГБ .csv) в установку Amazon EC2 RStudio, чтобы выполнить некоторые статистические расчеты.

У меня мало опыта работы с unix/linux. Есть ли способ загрузки непосредственно в RStudio?

Спасибо!


person Dan    schedule 06.04.2015    source источник
comment
RStudio Server не обрабатывает загрузку файлов напрямую с локального сервера. Его рабочая среда зависит от файловой системы, в которой он установлен (EC2). Из соображений стоимости и удобства вам, вероятно, следует рассмотреть загрузку/хранение файла на S3 и настройку EC2/RStudio для чтения из него.   -  person economy    schedule 06.04.2015
comment
Есть ли простой способ настроить EC2/RStudio для чтения с S3. Есть ли опыт/лучшие практики? Спасибо большое!   -  person Dan    schedule 20.04.2015


Ответы (1)


Сначала сделайте свой файл в S3 общедоступным, выбрав файл, а затем выберите Сделать общедоступным в раскрывающемся списке — Действие, щелкните файл правой кнопкой мыши, чтобы просмотреть свойства, и скопируйте ссылку (http://s3-us-west....)и затем прочитайте CSV-файл, как показано ниже: ‹-read.csv ("ссылка", заголовок=ИСТИНА)

person Suresh    schedule 31.05.2016