У меня есть небольшое расширение scrapy, которое просматривает объект статистики сканера и отправляет мне электронное письмо, если сканер выдал сообщения журнала определенного типа (например, ПРЕДУПРЕЖДЕНИЕ, КРИТИЧЕСКОЕ, ОШИБКА).
Эта статистика доступна через объект статистики пауков (crawler.stats.get_stats()), например:
crawler.stats.get_stats().items()
[..]
'log_count/DEBUG': 9,
'log_count/ERROR': 2,
'log_count/INFO': 4,
[..]
Если я запускаю паука на scrapinghub, статистики журнала там нет. Есть много других тонкостей (например, количество исключений и т. д.), но количество журналов отсутствует. Кто-нибудь знает, как их туда достать или как получить к ним доступ на скрейпинг-хабе?
Я также проверил значения «Dumping Scrapy stats» после закрытия паука. Если я запускаю его на своей машине, количество журналов есть, если я запускаю его на очистке, количество журналов отсутствует.
crawler.stats.get_stats()
вместоspider.stats.get_stats()
? - person bosnjak   schedule 03.12.2014