Я не знаю, что происходит за кулисами с этими объектами, но я все время использую их с большим успехом.
dim ie As New SHDocVw.InternetExplorer
ie.navigate url
Set oDoc = ie.Document
iT = oDoc.body.innerText
И
dim oX As New MSXML2.XMLHTTP
dim oDoc As HTMLDocument
oX.Open "GET", url, False
oX.send
rT = oX.responseText
Но для одной конкретной веб-страницы объект ie зависает, создает ошибки, заставляет мой жесткий диск биться и полностью расстраивает меня.
Мне нравится объект MSXML2, потому что он всегда работает быстро и без проблем. Проблема на этой конкретной веб-странице заключается в том, что она не возвращает правильную информацию. Кажется, что он получает не ту страницу или не получает все это.
Моим минимальным требованием является получение всего HTML-кода для страницы — оттуда я могу выполнить синтаксический анализ.
Вот пример страниц, которые я пытаюсь получить: http://www.nfl.com/gamecenter/2011090800/2011/REG1/saints@packers?icampaign=GC_schedule_rr#menu=highlights&tab=analyze&analyze=playbyplay
Моя цель — вернуть их все, начиная примерно с 2001 года, когда они начали вести запись каждой игры. Что-то в технологии, которую они используют, расстраивает, например, и блокирует msxml2.
Любые предложения, чтобы заставить меня идти в правильном направлении?