Вопросы по теме 'cheerio'
Получение элемента с помощью xpath и cheerio
Пытаюсь написать в node.js функцию, которая будет получать элемент по xpath.
У меня есть xpath желаемого элемента dom, например
xpath = '/html/body/div/div[2]/div/h1/span'
Мой DOM загружается в cheerio через модуль fs (потому что эта...
16758 просмотров
schedule
15.03.2023
Невозможно извлечь фрагмент html с помощью cheerio
Я использую cheerio для выполнения некоторых манипуляций с html на сервере node js. У меня есть html-строка, подобная этой
var htmlString =" <ol>
<li>
<p>item1</p>
</li>
<li>
<p>item2</p>...
1164 просмотров
schedule
03.10.2022
перезвонить на cheerio node.js
Я пытаюсь написать скрейпер , используя «request» и «cheerio». У меня есть массив из 100 URL-адресов. Я перебираю массив и использую «запрос» для каждого URL-адреса, а затем делаю cheerio.load (тело). Если я увеличу i выше 3 (т. е. изменю его на i...
2473 просмотров
schedule
27.09.2023
Node Cheerio для очистки всего сайта
Кто-нибудь использовал Node Cheerio для очистки всего сайта, а не только домашней / первой страницы, на которую указывает парсер?
В данный момент я делаю следующее, что очищает только целевую страницу.
request('http://arandomsite.com/',...
1342 просмотров
schedule
04.08.2022
Могу ли я загрузить локальный HTML-файл с пакетом cheerio в node.js?
У меня есть несколько html-файлов на жестком диске, из которых я хотел бы использовать jquery для извлечения данных. Возможно ли это сделать с помощью Cheerio? Я пытался дать Cheerio локальный путь, но он не работает. Одна из идей, которые у меня...
18630 просмотров
schedule
21.10.2022
Jsdom выдает ошибку скрипту внешнего ресурса (скрипт на странице) после возврата результата
Я получаю сообщение об ошибке, которое, по-видимому, связано с одним из сценариев страницы.
file://cdn.widgets.webengage.com/js/widget/webengage-min-v-3.0.js:1
return c.apply(undefined,a)}catch(d){webengage.eLog(d);if(!b){throw d}}}else{t...
579 просмотров
schedule
25.04.2023
Как получить немедленного ребенка в Cheerio
Я пытаюсь разобрать ужасный веб-сайт, и мне нужна помощь с использованием cheerio.
Я знаю, что если я, например, хочу получить html тела html, я делаю
$('body','html').html();
Как спуститься по нескольким элементам?
(Что, если я хочу...
1747 просмотров
schedule
03.02.2023
Как получить последний массив
Используя cheerio, мне удалось очистить сгенерированную PHP таблицу, содержащую столбец дат, местоположений и т. д. Поскольку количество строк является переменным, я решил использовать .map() для итерации по каждой строке, устанавливая соответствующее...
55 просмотров
schedule
23.09.2023
.each и обратные вызовы
Я использую модули узла request и cheerio для получения данных с веб-сайта. Я хочу получить список элементов, и как только этот список будет завершен, вызовите асинхронную функцию:
request('http://myurl', function(req,res,data){
var $ =...
12206 просмотров
schedule
23.04.2022
HTML-код навигации с помощью парсера веб-страниц Cheerio
Я следую это руководство по очистке экрана с помощью cheerio для Node.js, и я в 2-х секундах от того, чтобы просто загрузить всю страницу и использовать Javascript для извлечения необходимой информации, что я m конечно, это намного сложнее, чем на...
897 просмотров
schedule
19.02.2023
jQuery для доступа к DOM на сайте
Я пытаюсь извлечь различные элементы из таблицы с этого сайта , чтобы научиться парсить с помощью узла .js, приветствие и запрос
У меня проблемы с получением элементов в таблице, по сути, я хочу получить из таблицы «ранг», «компания» и «3-летний...
104 просмотров
schedule
17.02.2023
Попытка получить список песен на сайте не работает
Я попытался использовать phantomjs, cheerio в узле и элемент управления webBrowser на C #, чтобы получить свой список песен, я могу успешно получить html, но без списка песен я не могу понять, почему я не могу его получить ...
Единственный способ,...
182 просмотров
schedule
01.10.2022
Асинхронные веб-запросы вызывают «зависание сокета» в node.js
Я пишу код, который «for» циклически повторяет большое количество раз для очистки веб-страниц. Код такой:
var request = require('request');
for(i=0; i<10000; i++){
//request goes here, with processing in its callback
}
Но это вызывает...
511 просмотров
schedule
09.12.2022
как извлечь html-контент с помощью xpath с помощью модуля nodejs
Я ищу экстрактор содержимого html с использованием xpath, я видел различные модули nodejs для этого, например
jsdom, htmlparser2, xpath, cheerio
Я обнаружил, что cheerio лучше для получения данных с использованием класса, идентификатора,...
1819 просмотров
schedule
17.04.2022
Парсинг веб-сайта, созданного с помощью JavaScript, с помощью Node.js
Когда я анализирую статическую HTML-страницу, мое приложение node.js работает хорошо. Однако, когда URL-адрес представляет собой страницу, созданную с помощью JavaScript, приложение не работает. Как я могу очистить веб-страницу, созданную с помощью...
1062 просмотров
schedule
29.12.2022
получение дополнительной информации при просмотре веб-страниц с помощью cheerio js
Я работаю с cheerio.js, чтобы сделать простой парсер. По какой-то причине он не отвечает на определенные теги html. Один div, на который я не могу настроить таргетинг, — это div с классом 'dataTables_scrollBody' на веб-сайте, который я очищаю:...
172 просмотров
schedule
06.02.2023
Парсер Node.js Cheerio ломает кодировку UTF-8
Я разбираю свой запрос с Cheerio следующим образом:
var url = http://shop.nag.ru/catalog/16939.IP-videonablyudenie-OMNY/16944.IP-kamery-OMNY-c-vario-obektivom/16704.OMNY-1000-PRO;
request.get(url, function (err, response, body) {...
13920 просмотров
schedule
01.09.2022
jquery/cheerio: как выбрать несколько элементов?
Мне нужно проанализировать разметку, подобную этой, с html-страницы:
<a href="#">
<i class="icon-location"></i>London
</a>
Мне нужно попасть в Лондон .
Я пробовал что-то вроде (используя cheerio ):
$('a',...
4054 просмотров
schedule
16.12.2023
Селекторы cheerio / jquery: как получить список элементов во вложенных div?
Мне нужно разобрать некоторую разметку, подобную этой, со страницы html:
<div id="list">
<div class="item-level-a">
<div class="item-level-b">
<a href="http://www.example.com/1"></a>
</div>...
50220 просмотров
schedule
23.07.2023
Соскоб веб-страницы Nodejs с помощью файла cookie аутентификации
В последнее время я пытаюсь собрать информацию с веб-сайта ( kicktipp ), используя Nodejs, модуль запроса и cheerio. Поскольку этот сайт требует аутентификации для просмотра большинства его сайтов, я попытался войти в систему с помощью почтового...
9876 просмотров
schedule
24.12.2022