Я загрузил своего паука на scrapyhub. Я понимаю, как загружать с моим *.txt файлом, но как мне его использовать?
Мой файл setup.py выглядит так:
setup(
name = 'project',
version = '1.0',
packages = find_packages(),
package_data={
'youtube_crawl': ['resources/Names.txt']
},
entry_points = {'scrapy': ['settings = youtube_crawl.settings']},
)
Затем я хочу использовать этот Name.txt.
перед загрузкой мой паук выглядит так
def parse(self, response):
with open('resources/Names.txt','rt') as f:
for link in f:
url = "https://www.youtube.com/results?search_query={}".format(link)
name = link.replace('+',' ')
yield Request(url, meta={'name':name}, callback=self.parse_page, dont_filter=True)
Итак, мой вопрос: как я могу использовать свой файл в хабе для очистки?
Я попробовал этот код, но не понимаю, как он работает и как интегрировать его с моим кодом =)
data = pkgutil.get_data("youtube_crawl", "resources/Names.txt")
Функция возвращает двоичную строку, являющуюся содержимым указанного ресурса.