Я использую сценарий scrapy для загрузки URL-адреса с помощью «доходности».
MyUrl = "www.example.com"
request = Request(MyUrl, callback=self.mydetail)
yield request
def mydetail(self, response):
item['Description'] = response.xpath(".//table[@class='list']//text()").extract()
return item
Загрузка URL-адреса занимает не менее 5 секунд. Поэтому я хочу, чтобы Scrapy подождал некоторое время, чтобы загрузить весь текст в элемент ['Описание']. Я пробовал «DOWNLOAD_DELAY» в settings.py, но бесполезно.
scrapy shell <url>
, чтобы увидеть, что scrapy видит сайт. Вам нужно проверить, что еще извлекает страница, и изменить свой код, чтобы он соответствовал этому, или использовать безголовый браузер для отображения javascript страницы. (например, всплеск, селен) - person marven   schedule 28.02.2015