Скачивание pdf-файла с помощью RSelenium

Я пытаюсь сделать с пакетом RSelenium,

Шаг: 1 Доступ к веб-сайту - Мой собственный поставщик услуг электроснабжения

Шаг: 2 Войдите в мою учетную запись, явно указав свое имя пользователя и пароль (по этой причине я не могу поделиться кодом)

Шаг: 3 Я нажимаю «ПРОСМОТРЕТЬ СЧЕТ». Счет отображается в формате pdf.

Есть ли способ загрузить этот файл и сохранить его в определенной папке? Когда я использовал команду download.file(), она не сохраняет документ, вместо этого я получаю файл pdf размером 3 КБ, который я не могу открыть. Adobe Reader сообщает, что при чтении документа произошла ошибка.

Возможный метод, который я пробовал: 1. Щелкните правой кнопкой мыши, нажмите стрелку вниз четыре раза, а затем перейдите к «СОХРАНИТЬ СТРАНИЦУ КАК» и нажмите Enter.

Но затем появляется диалоговое окно с запросом имени и местоположения файла, и я не могу ввести эти данные через RSelenium и сохранить файл.

Пример кода: какой-то случайный PDF-файл, найденный в Интернете.

url<- "http://www.immigrationpolicy.org/sites/default/files/docs/how_us_immig_system_works.pdf"

setwd("C:/Users/king/Desktop/bill")
library(RSelenium)
library(downloader)
checkForServer()
startServer()
remDr <- remoteDriver()
remDr$open()
remDr$navigate(url)

person Bharath    schedule 27.12.2015    source источник
comment
Интересный вопрос. Вы можете привести минимальный рабочий пример? stackoverflow.com/help/how-to-ask   -  person Tyler Rinker    schedule 27.12.2015


Ответы (1)


Я нашел ответ в постоянных исследованиях.

Сначала проверьте, установлен ли Rtools (нашел ответ используя эту ссылку)

Потом обновил мою программу

cprof<-makeFirefoxProfile(list(
  "pdfjs.disabled"=TRUE,
  "plugin.scan.plid.all" = FALSE,
  "plugin.scan.Acrobat" = "99.0",
  "browser.helperApps.neverAsk.saveToDisk"='application/pdf',
  ))
remDr <- remoteDriver(extraCapabilities=cprof)

Я все еще пытаюсь изменить папку загрузки, которую пока не могу найти. Я нашел ответ от ЭТА ссылка

person Bharath    schedule 27.12.2015
comment
Приведенный выше код работал только для примера в вопросе. Когда я попробовал код в своем реальном приложении, pdf-файл был автоматически загружен как .aspx файл. Но затем попытался переименовать файл в filename.pdf, это сработало. Я переименовал скачанный файл в .pdf. - person Bharath; 27.12.2015