Я использую Crawlera в качестве службы ротации IP-адресов для сканирования определенного веб-сайта, который быстро блокирует мой IP-адрес, но у меня есть эта проблема только с одним веб-сайтом из дюжины.
Поскольку для проекта Scrapy можно зарегистрировать несколько промежуточных программ, я хотел знать, можно ли определить промежуточное программное обеспечение загрузчика для использования ПО ЗАПРОСУ.
Таким образом, я мог использовать свою квоту Crawlera только для проблемного веб-сайта, а не для всех моих запросов.
scrapy-crawlera
, вы можете использоватьdont_proxy
для запросов, которые не нуждаются в Crawlera: scrapy-crawlera.readthedocs.io/en/v1.6.0/#how-to-use-it - person Gallaecio   schedule 01.06.2020