Вопросы по теме 'domcrawler'
DOMCrawler неправильно выгружает данные для синтаксического анализа
Я использую Symfony, Goutte и DOMCrawler для очистки страницы. К сожалению, на этой странице много устаревших таблиц данных и нет ни идентификаторов, ни классов, ни идентифицирующих факторов. Итак, я пытаюсь найти таблицу, анализируя исходный код,...
457 просмотров
schedule
18.09.2023
Как получить текст из элемента, исключая некоторые другие элементы внутри этого
Я использую domCrawler в фреймворке symfony. Я просканировал содержимое из html, используя его. Теперь мне нужно получить текст внутри элемента с идентификатором. Я могу исправить текст, используя приведенный ниже код:
$nodeValues =...
1556 просмотров
schedule
03.08.2023
Symfony 2 Dom Crawler: как получить только text() в Element
Использование Dom Crawler для получения только текста (без тега).
$html = EOT<<<
<div class="coucu">
Get Description <span>Coucu</span>
</div>
EOT;
$crawler = new Crawler($html);
$crawler =...
8239 просмотров
schedule
25.06.2023
Тесты формы: как отправить коллекцию в существующую форму?
Я использую два способа проверки своих форм:
Используя $form = …->form();
Затем задаем значения массива $form (точнее это объект \Symfony\Component\DomCrawler\Form ):
Полный пример из документации :
$form =...
1416 просмотров
schedule
02.02.2023
Symfony DomCrawler берет все элементы div в html-файле
Я хочу взять все элементы в html файле.
$crawler = new Crawler($html);
for($i = 0; $i < $crawler->filter("div")->count(); $i++){
$div = $crawler->filter("div")->html();
Делая это, я всегда беру первый элемент div: как я...
884 просмотров
schedule
26.06.2023
Запрос DomCrawler FilterXPath
У меня есть html, например, ниже:
<html>
<body>
... other html stuff ...
<form method="post" action="goSomewhere">
<input type="hidden" value="something">
<input type="hidden" value="something2">...
909 просмотров
schedule
14.05.2023
Как объединить текстовый узел из 2 фрагментов извлеченных данных с помощью Goutte/Domcrawler
Я пытался понять, как объединить два фрагмента извлеченного текста в один результат (массив). В данном случае название и подзаголовок различных книг.
<td class="item_info">
<span class="item_title">Carrots Like Peas</span>...
560 просмотров
schedule
08.06.2024
Присоединить URL-адреса в symfony/goutte
У меня есть Goutte/Client (goutte использует symfony для запросов), и я хотел бы соединить пути и получить конечный URL:
$client = new Goutte\Client();
$crawler = $client->request('GET', 'http://DOMAIN/some/path/')
// $crawler is instance of...
993 просмотров
schedule
07.07.2022
DOM Crawler и текущий список узлов пуст - как получить список
Мне нужна помощь с DOM Crawler в Symfony 3.2. Вот мой код:
$html = file_get_contents('http://www.wakacje.pl/wczasy/peru/');
$crawler = new Crawler($html);
$crawler = $crawler->filter('#gridWithPagination > div > div')->each(function...
5698 просмотров
schedule
18.04.2023
DomCrawler Symfony не находит определенный тег
Я использую DomCrawler для получения данных со страницы Google Play, и он работает в 99% случаев, за исключением того, что я наткнулся на страницу, на которой не может найти определенный элемент div. Я проверяю HTML-код, и он определенно там. Мой...
1035 просмотров
schedule
29.04.2024
Может получить только один результат Dom Crawler
пытаясь получить весь контент в h2 (чтобы получить заголовок статьи) в div id=firehoselist, но следующий код возвращает только первый результат. Любые идеи, пожалуйста
$crawler = new Crawler($content);...
259 просмотров
schedule
11.01.2024
Как выбрать ссылку, используя ее идентификатор или метку, с помощью сканера symfony dom?
Можно ли выбрать ссылку, используя ее идентификатор или класс с помощью сканера symfony?
Я попытался:
$crawler()->selectLink('#return-button')->link();
$crawler()->selectLink('.btn.return')->link();
Но у меня ошибка:...
1223 просмотров
schedule
07.06.2022
DomCrawler filterXpath не всегда дает полный URL
В своем проекте я использую domcrawler для анализа страниц и извлечения изображений.
Код:
$goutteClient = new Client();
$guzzleClient = new GuzzleClient(array(
'timeout' => 15,
));
$goutteClient->setClient($guzzleClient);
try {...
115 просмотров
schedule
15.11.2022