Scrapy shell - правильный селектор xpath для получения информации из таблицы?

Я пытаюсь получить правильный Xpath для извлечения информации, обведенной красным на изображении ниже:

введите здесь описание изображения

Я попытался скопировать xpath и вставить его в оболочку scrapy, но он не работает. У меня возникают трудности, потому что информация содержится внутри таблицы, и каждый элемент таблицы имеет одно и то же имя. Сайт

https://virtualmuebles.com/muebles-sala/mesa-tv-invy-1c-casa-linda-wg


person DP20    schedule 27.06.2020    source источник


Ответы (1)


Предположим, что текст Marca постоянен на всех страницах, которые вы хотите очистить. Сначала найдите элемент b, содержащий текст «Marca». Найдите его родителя, если это элемент td. Получите следующий родственный элемент, если это элемент td. Получите его текстовый узел:

response.xpath("//b[contains(text(),'Marca')]/parent::td/following-sibling::td/text()").get()

в противном случае, если это всегда второй элемент td четвертого элемента tr:

response.xpath("//tr[4]/td[2]/text()").get()

выходы:

'RTA Design'
person Dan-Dev    schedule 27.06.2020