Я пытаюсь загрузить статическое зеркало вики с помощью wget. Мне нужна только последняя версия каждой статьи (а не полная история или различия между версиями). Было бы легко просто загрузить все это целиком и удалить ненужные страницы позже, но это заняло бы слишком много времени и создало бы ненужную нагрузку на сервер.
Есть ряд страниц, которые мне явно не нужны, например:
КтоЧтоДелает?action=diff&date=1184177979
Есть ли способ запретить wget загружать и рекурсивно использовать URL-адреса, в которых есть «action = diff»? Или иным образом исключить URL-адреса, соответствующие некоторому регулярному выражению?