Xpath не возвращает ТЕКСТ из тегов ‹p› в Scrapy Shell

Ссылка: https://www.softwareadvice.com/hr/zenefits-profile

Я пытаюсь очистить описание из приведенной выше ссылки. XPath кажется правильным, но он не возвращает мне значение в scrapy shell. (Пожалуйста, смотрите скриншот ниже). Я пробовал все методы, такие как get(), getall(), extract(), extract_first(), extractall(), но получаю пустой список. Пожалуйста, помогите мне определить ошибку. Спасибо...

Нажмите, чтобы увидеть изображение (XPath)

Нажмите, чтобы увидеть изображение (Scrapy Shell)

CodeWithAwais 09.05.2020 источник

comment

Ваше выражение XPath верное. Веб-сайт использует JavaScript, поэтому вам нужно загрузить его. Лучший способ сделать это — выполнить pip install scrapy-splash. Используйте всплеск, и выражение будет работать. - dram95 09.05.2020

comment

@ dram95 не загружается с помощью javascript. - CodeWithAwais 09.05.2020

Ответы (1)

arrow_upward
1
arrow_downward

Если вы отключите JS, вы не обнаружите, что XPATH работает.

Вот как Scrapy загружает HTML, он загружает только HTML и не выполняет никаких JS/AJAX.

Попробуйте этот XPATH

response.xpath("/html/body/app-root/main/app-product/div[1]/app-product-detail/div[2]/div/div[1]/div/div/p//text()").getall()

Umair Ayub 09.05.2020

comment

спасибо, это сработало, но он получает только первый тег ‹p›. Как я могу получить все теги ‹p›? - CodeWithAwais; 09.05.2020

Xpath не возвращает ТЕКСТ из тегов ‹p› в Scrapy Shell

Ответы (1)

Вопросы по теме