Выберите несколько имен классов и получите дочерний узел внутри этого класса с помощью PHP DOMXpath.

<div id="conti">
  <div class="no_matter"></div>
  <div class="row-0">
    <b></b>
    <span>
      <i>"child node that i want to get"</i>
    </span>
  </div>

  <div class="row-1">
    <b></b>
    <span>
      <i>"child node that i want to get"</i>
    </span>
  </div>

  <div class="row-0">
    <b></b>
    <span>
      <i>"child node that i want to get"</i>
    </span>
  </div>

  <div class="row-1">
    <b></b>
    <span>
      <i>"child node that i want to get"</i>
    </span>
  </div>

  ...
  ...
  class row-0 and row-1 repeats itself
  ...
  ...

</div>

Это HTML, который я хочу проанализировать и получить содержимое. Я хочу text node inside <i> tag. Я использую DOMDocument и DOMXpath

$dom = new DOMDocument();
$dom->loadHTMLFile('http://www.meal.org/anter.php');
$dom->preserveWhiteSpace = true;

$xpath = new DOMXPath($dom);

$row = $xpath->query('//*[@class="row-0" ]');  //my problem begins there. I want both 'row-0' and 'row-1'. How i am gonna choose multiple class?

//and than how i am gonna get `<i>` tag inside every `row-0` and `row-1` class and get the text node?

person Webber Depor    schedule 06.03.2016    source источник


Ответы (3)


Все это можно сделать с помощью следующего запроса XPath:

//*[starts-with(@class,"row-")]/span/i/text()

MDN при запуске с:

starts-with проверяет, начинается ли первая строка со второй строки, и возвращает true или false.

Если вас интересуют все текстовые узлы в этих строках, а также узлы в тегах b и любые другие теги, которые могут быть в этих строках, используйте двойную косую черту:

//*[starts-with(@class,"row-")]//text()
person trincot    schedule 06.03.2016
comment
лучше, более ясный ответ. Есть ли хорошая документация для изучения DOMxpath::query - person Webber Depor; 06.03.2016
comment
Существует несколько ресурсов, таких как W3Schools. - person trincot; 06.03.2016

Я не знаком с XPath, поэтому я перебираю каждый элемент <div>, используя DOMDocument(). Проверьте, имеет ли он класс атрибута со значением row-0 или row-1. Если это так, то получите каждый элемент <i> и выгрузите nodeValue.

foreach($dom->getElementsByTagName('div') as $div){
    if($div->getAttribute('class') == 'row-0' OR $div->getAttribute('class') == 'row-1'){
        foreach($div->getElementsByTagName('i') as $i){
            var_dump($i->nodeValue);
        }
    }
}
person Fin    schedule 06.03.2016

person    schedule
comment
Вот это да. не знал /span/i вещь в конце. Еще один вопрос: как выбрать и /span/i, и /b? давайте предположим, что <b> тоже имеет текстовый узел - person Webber Depor; 06.03.2016
comment
Одним из способов было бы объединить запросы с использованием | следующим образом: $tags = $xpath->query('//div[@class="row-0" or @class="row-1"]/span/i | //div[@class="row-0" or @class="row-1"]/b'); - person davmos; 06.03.2016