Scrapy shell - правильный селектор xpath для получения информации из таблицы?

Я пытаюсь получить правильный Xpath для извлечения информации, обведенной красным на изображении ниже:

Я попытался скопировать xpath и вставить его в оболочку scrapy, но он не работает. У меня возникают трудности, потому что информация содержится внутри таблицы, и каждый элемент таблицы имеет одно и то же имя. Сайт

https://virtualmuebles.com/muebles-sala/mesa-tv-invy-1c-casa-linda-wg

DP20 27.06.2020 источник

Ответы (1)

arrow_upward
1
arrow_downward

Предположим, что текст Marca постоянен на всех страницах, которые вы хотите очистить. Сначала найдите элемент b, содержащий текст «Marca». Найдите его родителя, если это элемент td. Получите следующий родственный элемент, если это элемент td. Получите его текстовый узел:

response.xpath("//b[contains(text(),'Marca')]/parent::td/following-sibling::td/text()").get()

в противном случае, если это всегда второй элемент td четвертого элемента tr:

response.xpath("//tr[4]/td[2]/text()").get()

выходы:

'RTA Design'

Dan-Dev 27.06.2020

Scrapy shell - правильный селектор xpath для получения информации из таблицы?

Ответы (1)

Вопросы по теме