Вопросы по теме 'domcrawler'

DOMCrawler неправильно выгружает данные для синтаксического анализа
Я использую Symfony, Goutte и DOMCrawler для очистки страницы. К сожалению, на этой странице много устаревших таблиц данных и нет ни идентификаторов, ни классов, ни идентифицирующих факторов. Итак, я пытаюсь найти таблицу, анализируя исходный код,...
457 просмотров
schedule 18.09.2023

Как получить текст из элемента, исключая некоторые другие элементы внутри этого
Я использую domCrawler в фреймворке symfony. Я просканировал содержимое из html, используя его. Теперь мне нужно получить текст внутри элемента с идентификатором. Я могу исправить текст, используя приведенный ниже код: $nodeValues =...
1556 просмотров
schedule 03.08.2023

Symfony 2 Dom Crawler: как получить только text() в Element
Использование Dom Crawler для получения только текста (без тега). $html = EOT<<< <div class="coucu"> Get Description <span>Coucu</span> </div> EOT; $crawler = new Crawler($html); $crawler =...
8239 просмотров
schedule 25.06.2023

Тесты формы: как отправить коллекцию в существующую форму?
Я использую два способа проверки своих форм: Используя $form = …->form(); Затем задаем значения массива $form (точнее это объект \Symfony\Component\DomCrawler\Form ): Полный пример из документации : $form =...
1416 просмотров

Symfony DomCrawler берет все элементы div в html-файле
Я хочу взять все элементы в html файле. $crawler = new Crawler($html); for($i = 0; $i < $crawler->filter("div")->count(); $i++){ $div = $crawler->filter("div")->html(); Делая это, я всегда беру первый элемент div: как я...
884 просмотров
schedule 26.06.2023

Запрос DomCrawler FilterXPath
У меня есть html, например, ниже: <html> <body> ... other html stuff ... <form method="post" action="goSomewhere"> <input type="hidden" value="something"> <input type="hidden" value="something2">...
909 просмотров
schedule 14.05.2023

Как объединить текстовый узел из 2 фрагментов извлеченных данных с помощью Goutte/Domcrawler
Я пытался понять, как объединить два фрагмента извлеченного текста в один результат (массив). В данном случае название и подзаголовок различных книг. <td class="item_info"> <span class="item_title">Carrots Like Peas</span>...
560 просмотров
schedule 08.06.2024

Присоединить URL-адреса в symfony/goutte
У меня есть Goutte/Client (goutte использует symfony для запросов), и я хотел бы соединить пути и получить конечный URL: $client = new Goutte\Client(); $crawler = $client->request('GET', 'http://DOMAIN/some/path/') // $crawler is instance of...
993 просмотров
schedule 07.07.2022

DOM Crawler и текущий список узлов пуст - как получить список
Мне нужна помощь с DOM Crawler в Symfony 3.2. Вот мой код: $html = file_get_contents('http://www.wakacje.pl/wczasy/peru/'); $crawler = new Crawler($html); $crawler = $crawler->filter('#gridWithPagination > div > div')->each(function...
5698 просмотров
schedule 18.04.2023

DomCrawler Symfony не находит определенный тег
Я использую DomCrawler для получения данных со страницы Google Play, и он работает в 99% случаев, за исключением того, что я наткнулся на страницу, на которой не может найти определенный элемент div. Я проверяю HTML-код, и он определенно там. Мой...
1035 просмотров
schedule 29.04.2024

Может получить только один результат Dom Crawler
пытаясь получить весь контент в h2 (чтобы получить заголовок статьи) в div id=firehoselist, но следующий код возвращает только первый результат. Любые идеи, пожалуйста $crawler = new Crawler($content);...
259 просмотров
schedule 11.01.2024

Как выбрать ссылку, используя ее идентификатор или метку, с помощью сканера symfony dom?
Можно ли выбрать ссылку, используя ее идентификатор или класс с помощью сканера symfony? Я попытался: $crawler()->selectLink('#return-button')->link(); $crawler()->selectLink('.btn.return')->link(); Но у меня ошибка:...
1223 просмотров
schedule 07.06.2022

DomCrawler filterXpath не всегда дает полный URL
В своем проекте я использую domcrawler для анализа страниц и извлечения изображений. Код: $goutteClient = new Client(); $guzzleClient = new GuzzleClient(array( 'timeout' => 15, )); $goutteClient->setClient($guzzleClient); try {...
115 просмотров
schedule 15.11.2022