Я пытаюсь использовать Nokogiri для анализа HTML-файла с довольно эксцентричной разметкой. В частности, я пытаюсь захватить элементы div, в которых определены идентификаторы, несколько классов и стилей.
Разметка выглядит примерно так:
<div id="foo">
<div id="bar" class="baz bang" style="display: block;">
<h2>title</h2>
<dl>
List of stuff
</dl>
</div>
</div>
Я пытаюсь схватить <dl>
, который находится внутри проблемы <div>
. Я могу без проблем получить элементы div с одним атрибутом id, но не могу придумать, как заставить Nokogiri захватывать элементы div с классами id и.
Итак, они работают нормально:
content = @doc.xpath("//div[id='foo']")
content = @doc.css('div#foo')
Но они ничего не возвращают:
content = @doc.xpath("//div[id='bar']")
content = @doc.xpath("div#bar")
Есть ли что-то очевидное, что мне здесь не хватает?
<div>
на основе комбинации значений его атрибутов. - person Dimitre Novatchev   schedule 29.08.2010