Я пытаюсь очистить данные с защищенного паролем веб-сайта в R. Читая, кажется, что пакеты httr и RCurl - лучшие варианты для очистки с аутентификацией по паролю (я также изучил пакет XML).
Веб-сайт, который я пытаюсь очистить, находится ниже (вам нужна бесплатная учетная запись для доступа к полной странице): http://subscribers.footballguys.com/myfbg/myviewprojection.php?projector=2
Вот две мои попытки (замена «имени пользователя» на мое имя пользователя и «пароль» на мой пароль):
#This returns "Status: 200" without the data from the page:
library(httr)
GET("http://subscribers.footballguys.com/myfbg/myviewprojections.php?projector=2", authenticate("username", "password"))
#This returns the non-password protected preview (i.e., not the full page):
library(XML)
library(RCurl)
readHTMLTable(getURL("http://subscribers.footballguys.com/myfbg/myviewprojections.php?projector=2", userpwd = "username:password"))
Я просмотрел другие соответствующие сообщения (ссылки ниже), но не могу понять, как применить их ответы в моем случае.
Чтение информации с сайта, защищенного паролем
R - RCurl очищает данные с сайта, защищенного паролем
http://www.inside-r.org/questions/how-scrape-data-password-protected-https-website-using-r-hold.