Я знаю, что вы не хотите возвращаться к каждой странице, но вам действительно не нужно анализировать всю страницу, просто ищите html, который всегда предшествует записи. Из того, что я только запускаю историю веб-поиска Google и выполняю несколько простых поисков, если вы просматриваете страницу истории, каждая строка, которую вы искали, следует: <td style="padding:3px 0"><table id=bkmk_view_ class=noborder ><tr><td><table class="elem noborder"><tr><td class="grey" nowrap>Searched for </td><td nowrap><a title="http://www.google.com/search?q=
и за ней следует &
(амперсанд). Эта последовательность предшествующих html-кодов уникальна на странице и появляется только в том случае, если в списке указаны исторические условия поиска.
Если вы используете два термина, вы получаете + между терминами. Другие соглашения для разных режимов поиска, я их все не рассматривал.
Похоже, что если вы используете метод BalusC для передачи параметров, вы можете получить html, найти в документе строку, которую я упомянул (обязательно \" и другие специальные символы), затем скопируйте следующую строку, пока не достигнете символ & , Затем все, что вам нужно сделать, это проанализировать ваш поисковый запрос, а не всю страницу. Пройдитесь по исходному коду, пока не дойдете до конца, а затем перейдите к следующей итерации в цикле.
person
Jake Stevens-Haas
schedule
09.12.2010