Вопросы по теме 'cheerio'

Получение элемента с помощью xpath и cheerio
Пытаюсь написать в node.js функцию, которая будет получать элемент по xpath. У меня есть xpath желаемого элемента dom, например xpath = '/html/body/div/div[2]/div/h1/span' Мой DOM загружается в cheerio через модуль fs (потому что эта...
16758 просмотров
schedule 15.03.2023

Невозможно извлечь фрагмент html с помощью cheerio
Я использую cheerio для выполнения некоторых манипуляций с html на сервере node js. У меня есть html-строка, подобная этой var htmlString =" <ol> <li> <p>item1</p> </li> <li> <p>item2</p>...
1164 просмотров
schedule 03.10.2022

перезвонить на cheerio node.js
Я пытаюсь написать скрейпер , используя «request» и «cheerio». У меня есть массив из 100 URL-адресов. Я перебираю массив и использую «запрос» для каждого URL-адреса, а затем делаю cheerio.load (тело). Если я увеличу i выше 3 (т. е. изменю его на i...
2473 просмотров
schedule 27.09.2023

Node Cheerio для очистки всего сайта
Кто-нибудь использовал Node Cheerio для очистки всего сайта, а не только домашней / первой страницы, на которую указывает парсер? В данный момент я делаю следующее, что очищает только целевую страницу. request('http://arandomsite.com/',...
1342 просмотров

Могу ли я загрузить локальный HTML-файл с пакетом cheerio в node.js?
У меня есть несколько html-файлов на жестком диске, из которых я хотел бы использовать jquery для извлечения данных. Возможно ли это сделать с помощью Cheerio? Я пытался дать Cheerio локальный путь, но он не работает. Одна из идей, которые у меня...
18630 просмотров
schedule 21.10.2022

Jsdom выдает ошибку скрипту внешнего ресурса (скрипт на странице) после возврата результата
Я получаю сообщение об ошибке, которое, по-видимому, связано с одним из сценариев страницы. file://cdn.widgets.webengage.com/js/widget/webengage-min-v-3.0.js:1 return c.apply(undefined,a)}catch(d){webengage.eLog(d);if(!b){throw d}}}else{t...
579 просмотров
schedule 25.04.2023

Как получить немедленного ребенка в Cheerio
Я пытаюсь разобрать ужасный веб-сайт, и мне нужна помощь с использованием cheerio. Я знаю, что если я, например, хочу получить html тела html, я делаю $('body','html').html(); Как спуститься по нескольким элементам? (Что, если я хочу...
1747 просмотров
schedule 03.02.2023

Как получить последний массив
Используя cheerio, мне удалось очистить сгенерированную PHP таблицу, содержащую столбец дат, местоположений и т. д. Поскольку количество строк является переменным, я решил использовать .map() для итерации по каждой строке, устанавливая соответствующее...
55 просмотров
schedule 23.09.2023

.each и обратные вызовы
Я использую модули узла request и cheerio для получения данных с веб-сайта. Я хочу получить список элементов, и как только этот список будет завершен, вызовите асинхронную функцию: request('http://myurl', function(req,res,data){ var $ =...
12206 просмотров
schedule 23.04.2022

HTML-код навигации с помощью парсера веб-страниц Cheerio
Я следую это руководство по очистке экрана с помощью cheerio для Node.js, и я в 2-х секундах от того, чтобы просто загрузить всю страницу и использовать Javascript для извлечения необходимой информации, что я m конечно, это намного сложнее, чем на...
897 просмотров
schedule 19.02.2023

jQuery для доступа к DOM на сайте
Я пытаюсь извлечь различные элементы из таблицы с этого сайта , чтобы научиться парсить с помощью узла .js, приветствие и запрос У меня проблемы с получением элементов в таблице, по сути, я хочу получить из таблицы «ранг», «компания» и «3-летний...
104 просмотров
schedule 17.02.2023

Попытка получить список песен на сайте не работает
Я попытался использовать phantomjs, cheerio в узле и элемент управления webBrowser на C #, чтобы получить свой список песен, я могу успешно получить html, но без списка песен я не могу понять, почему я не могу его получить ... Единственный способ,...
182 просмотров

Асинхронные веб-запросы вызывают «зависание сокета» в node.js
Я пишу код, который «for» циклически повторяет большое количество раз для очистки веб-страниц. Код такой: var request = require('request'); for(i=0; i<10000; i++){ //request goes here, with processing in its callback } Но это вызывает...
511 просмотров
schedule 09.12.2022

как извлечь html-контент с помощью xpath с помощью модуля nodejs
Я ищу экстрактор содержимого html с использованием xpath, я видел различные модули nodejs для этого, например jsdom, htmlparser2, xpath, cheerio Я обнаружил, что cheerio лучше для получения данных с использованием класса, идентификатора,...
1819 просмотров
schedule 17.04.2022

Парсинг веб-сайта, созданного с помощью JavaScript, с помощью Node.js
Когда я анализирую статическую HTML-страницу, мое приложение node.js работает хорошо. Однако, когда URL-адрес представляет собой страницу, созданную с помощью JavaScript, приложение не работает. Как я могу очистить веб-страницу, созданную с помощью...
1062 просмотров

получение дополнительной информации при просмотре веб-страниц с помощью cheerio js
Я работаю с cheerio.js, чтобы сделать простой парсер. По какой-то причине он не отвечает на определенные теги html. Один div, на который я не могу настроить таргетинг, — это div с классом 'dataTables_scrollBody' на веб-сайте, который я очищаю:...
172 просмотров
schedule 06.02.2023

Парсер Node.js Cheerio ломает кодировку UTF-8
Я разбираю свой запрос с Cheerio следующим образом: var url = http://shop.nag.ru/catalog/16939.IP-videonablyudenie-OMNY/16944.IP-kamery-OMNY-c-vario-obektivom/16704.OMNY-1000-PRO; request.get(url, function (err, response, body) {...
13920 просмотров
schedule 01.09.2022

jquery/cheerio: как выбрать несколько элементов?
Мне нужно проанализировать разметку, подобную этой, с html-страницы: <a href="#"> <i class="icon-location"></i>London </a> Мне нужно попасть в Лондон . Я пробовал что-то вроде (используя cheerio ): $('a',...
4054 просмотров
schedule 16.12.2023

Селекторы cheerio / jquery: как получить список элементов во вложенных div?
Мне нужно разобрать некоторую разметку, подобную этой, со страницы html: <div id="list"> <div class="item-level-a"> <div class="item-level-b"> <a href="http://www.example.com/1"></a> </div>...
50220 просмотров
schedule 23.07.2023

Соскоб веб-страницы Nodejs с помощью файла cookie аутентификации
В последнее время я пытаюсь собрать информацию с веб-сайта ( kicktipp ), используя Nodejs, модуль запроса и cheerio. Поскольку этот сайт требует аутентификации для просмотра большинства его сайтов, я попытался войти в систему с помощью почтового...
9876 просмотров
schedule 24.12.2022