Вопросы по теме 'scrape'

Очистите URL-адрес веб-сайта, чтобы получить путь к изображению
Я собираю простой php-скрипт, который создаст список фотоальбомов, которые есть у меня на моей фан-странице в Facebook. Facebook любезно предлагает Graph API, который возвращает мне хороший список альбомов, однако они больше не предоставляют путь к...
2169 просмотров
schedule 02.08.2022

Использование SoupStrainer для выборочного анализа
Я пытаюсь разобрать список названий видеоигр с торгового сайта. однако, поскольку список элементов хранится внутри тега. Это раздел документации предположительно объясняет, как анализировать только часть документа, но я не могу это понять. мой...
13522 просмотров
schedule 16.02.2023

Пожалуйста, помогите: как я могу очистить эту веб-страницу?
Есть сайт, который предлагает услугу поиска. Вы вводите число, выполняете поиск, и он возвращает результаты. Что я хочу сделать, так это запустить этот поиск программно через coldfusion вместо того, чтобы заходить на сайт и искать вручную. Вот...
632 просмотров
schedule 21.09.2023

Очистить данные с сайта только во флеш-памяти
Я немного знаю javascript, HTML, CSS, VBA и просто общие структуры программирования (функции, циклы и т. Д.) Как бы вы подошли к этой проблеме. Веб-сайт ставок на спорт публикует числовые данные (шансы) на своем веб-сайте только во флэш-памяти....
1621 просмотров
schedule 07.05.2022

Разобрать/сохранить/получить ответ csv с URL-адреса с помощью NodeJS
Я пытаюсь получить результаты из финансового URL-адреса Yahoo: http://finance.yahoo.com/d/quotes.csv?s=XOM=sn1yr , который возвращает: "XOM",4:00pm - <b>83.25`</b>`,2.11,13.42 Я пытаюсь сохранить эти результаты в базе данных с...
3956 просмотров
schedule 05.06.2023

XPath соответствует каждому узлу, содержащему текст
Как рекурсивно сопоставить все дочерние узлы, содержащие текст. Если у меня есть дерево вроде table tr td "hello" td b "hi" tr td "salud" td em "bonjour" Как сопоставить каждую строку в узле таблицы с помощью...
1211 просмотров
schedule 28.01.2023

Как я могу очистить данные из текстовой таблицы с помощью Python?
У меня есть следующий текст, и я хотел бы очистить элементы данных и сохранить их в Excel. Есть ли способ сделать это в Python? text = """ ANNUAL COMPENSATION LONG-TERM COMPENSATION...
1875 просмотров
schedule 20.06.2022

Как очистить описание в результатах поиска Google
Я разрабатываю приложение с использованием vb.net, мое приложение будет выполнять простой поиск в Google с помощью управления веб-браузером, приложение будет очищать результаты Ссылки и их описание, мне удалось очистить ссылку, но я не могу очистить...
936 просмотров
schedule 10.04.2023

PHP очищает HTML между тегами ‹pre›
I'm having trouble with finding out how to scrape HTML content from only inside and tags with PHP5. Я хочу взять пример следующего документа, взять 2 (или более областей с предварительными тегами, его динамика) и засунуть их в массив....
1394 просмотров
schedule 30.09.2022

PHP очищает изображения из строки - как?
Я новичок в PHP... в любом случае - как мне получить все ссылки на изображения из этой строки? (в массив) { "imagedata": { "duration": 4000, "images":{ "image1":{...
242 просмотров
schedule 27.08.2022

Python: правильный URL-адрес для загрузки изображений из Google Image Search
Я пытаюсь получить изображения из поиска изображений Google для определенного запроса. Но на странице, которую я загружаю, нет изображений, и она перенаправляет меня на исходную страницу Google. Вот мой код: AGENT_ID = "Mozilla/5.0 (X11; Linux...
6922 просмотров
schedule 31.08.2022

Скрапинг данных в Stata
У меня есть 40 000 файлов HTML. В каждом файле есть таблица, содержащая отчет о прибылях и убытках конкретной компании. Я хотел бы очистить все эти данные в Stata. (Или, как вариант, в файл Excel/CSV). Конечным продуктом должен быть файл...
1744 просмотров
schedule 15.10.2022

Facebook Linter возвращает «Ошибка синтаксического анализа URL-адреса: ошибка синтаксического анализа входного URL-адреса, данные не были извлечены».
facebook возвращает «Ошибка синтаксического анализа URL-адреса: ошибка синтаксического анализа входного URL-адреса, данные не были удалены». когда я использую Facebook Linter. Я уже пытался удалить метатеги, а затем снова вставить их. Я не могу...
1441 просмотров

Очистите определенную область содержимого сайта с помощью безопасного входа
Я пытаюсь очистить некоторый конкретный текст веб-сайта, вход в систему которого защищен. Вот учебник по этому вопросу с использованием curl http://www.digeratimarketing.co.uk/2008/12/16/curl-page-сценарийочистки/ Но я не могу реализовать это в...
500 просмотров
schedule 03.07.2023

Как я могу найти и очистить класс с помощью WatiN?
Я использую WatiN и пытаюсь очистить URL-адрес изображения из веб-ссылки на основе класса полей. При просмотре кодов сайтов информация об изображениях отображается следующим образом: //images code <div class="doc-banner-icon"> <img...
797 просмотров
schedule 04.05.2023

Beautifulsoup не может извлечь данные, используя attrs=class
Я извлекаю данные для исследовательского проекта и успешно использовал findAll('div', attrs={'class':'someClassName'}) на многих веб-сайтах, но на этом конкретном веб-сайте Ссылка на веб-сайт не возвращает никаких значений, когда я...
3593 просмотров
schedule 24.10.2022

Как очищать и виртуально объединять вики-статьи?
Итак, у нашей компании есть большое количество внутренних вики-сайтов для разных отделов, и я ищу способ их объединить. Мы продолжаем пытаться убедить всех использовать одну и ту же вики, но это никогда не срабатывает, они все время хотят создавать...
200 просмотров

Извлеките/очистите javascript window.open из статического html-файла, используя php
Я пытаюсь очистить кучу локальных html-файлов. У каждого из них есть фрагмент javascript, встроенный в файл, с другим путем window.open, например: <script> function goTo() { if (document.getElementById('somedomain').checked) {...
914 просмотров
schedule 28.06.2022

Веб-скрейпинг с Nokogiri::HTML и Ruby — проблема вывода в CSV
У меня есть скрипт, который очищает HTML-страницы статей интернет-магазина. Я тестирую набор из 22 страниц, из которых 5 страниц со статьями содержат описание продукта, а остальные — нет. Этот код выводит правильную информацию на экран: if...
550 просмотров
schedule 21.05.2022

Парсинг веб-страниц с помощью Nokogiri::HTML и Ruby — сохранение изображений
Я работаю над скриптом для получения данных и изображений со страниц продуктов интернет-магазина (с одобрения владельца) У меня есть рабочий скрипт, который перебирает CSV-файл с URL-адресами продуктов 20042, чтобы получить нужные мне данные,...
1699 просмотров
schedule 15.06.2022