Получить незапутанный источник из браузера после клика

На веб-странице часть содержимого запутана каким-то изощренным способом (по крайней мере, для меня). Я не могу расшифровать это из источника страницы. В любом случае, при нажатии на ссылку на странице вызывается функция java onclick, и страница становится доступной для чтения. В этот момент сгенерированный исходный код в браузере также доступен для чтения.

Есть ли инструмент программирования (например, механизировать или что-то в этом роде, предпочтительно perl), который загружал бы страницу в Firefox, щелкал ссылку, а затем получал незачищенный html?

Любые предложения, как атаковать эту проблему?


person Boocko    schedule 01.12.2010    source источник
comment
Это связано с Java-апплетом?   -  person Weegee    schedule 02.12.2010
comment
Я так не думаю. Вызов выглядит следующим образом: onclick=qc.pA('FrontEndForm', 'PEditionV2c12', 'QClickEvent', '15731c4127a96e4111ee4eb5af51575504', 'WaitIcon'); вернуть ложь; но нигде не могу найти определение этой функции.   -  person Boocko    schedule 02.12.2010


Ответы (3)


Попробуйте использовать Chrome и проверьте параметр деобфускации источника в инструментах разработчика, средство просмотра javascript.

person avi    schedule 14.07.2011

Я бы использовал Firebug для просмотра деобфускированного кода.

При просмотре исходного кода браузеры будут отображать исходный исходный код, а не текущую модель DOM. Когда вы просматриваете исходный код с помощью Firebug, он покажет вам текущий источник, который в данный момент показывает ваш браузер.

Этот подход будет работать, только если вы хотите увидеть HTML, а не если вам нужно программное извлечение.

person TelegramSam    schedule 01.12.2010
comment
Да, я видел текст, который хочу извлечь со страницы в Firebug и с плагином WebDeveloper (View Generated Source). Теперь самое сложное — извлечь HTML-код скриптом. - person Boocko; 02.12.2010

Попробуйте надстройку Greasemonkey для Firefox.

Вы можете написать небольшую функцию javascript, которая нажимает эту кнопку для вас, например. каждый раз, когда вы загружаете страницу в Firefox. Посетите userscripts.org, чтобы начать.

Это будет работать (внутри вашего браузера) только для одного клиента, и это вы.

Если вам нужна полная автоматизация, вы можете попробовать записать тестовый пример Selenium. Для этого вы можете использовать другую надстройку Firefox, «Selenium IDE» (ветераны Microsoft Office назвали бы это «Macro Recorder») и даже преобразовать записанный тестовый пример в код Perl.

(Для запуска тестового примера потребуется запустить еще один небольшой компонент, selenium rc (сервер на основе Java), который запустит для вас firefox и щелкнет ссылку.

person knb    schedule 01.12.2010
comment
Спасибо за идею Selenium, я посмотрю. - person Boocko; 02.12.2010