Вопросы по теме 'scrape'
Очистите URL-адрес веб-сайта, чтобы получить путь к изображению
Я собираю простой php-скрипт, который создаст список фотоальбомов, которые есть у меня на моей фан-странице в Facebook.
Facebook любезно предлагает Graph API, который возвращает мне хороший список альбомов, однако они больше не предоставляют путь к...
2169 просмотров
schedule
02.08.2022
Использование SoupStrainer для выборочного анализа
Я пытаюсь разобрать список названий видеоигр с торгового сайта. однако, поскольку список элементов хранится внутри тега.
Это раздел документации предположительно объясняет, как анализировать только часть документа, но я не могу это понять. мой...
13522 просмотров
schedule
16.02.2023
Пожалуйста, помогите: как я могу очистить эту веб-страницу?
Есть сайт, который предлагает услугу поиска. Вы вводите число, выполняете поиск, и он возвращает результаты. Что я хочу сделать, так это запустить этот поиск программно через coldfusion вместо того, чтобы заходить на сайт и искать вручную.
Вот...
632 просмотров
schedule
21.09.2023
Очистить данные с сайта только во флеш-памяти
Я немного знаю javascript, HTML, CSS, VBA и просто общие структуры программирования (функции, циклы и т. Д.)
Как бы вы подошли к этой проблеме. Веб-сайт ставок на спорт публикует числовые данные (шансы) на своем веб-сайте только во флэш-памяти....
1621 просмотров
schedule
07.05.2022
Разобрать/сохранить/получить ответ csv с URL-адреса с помощью NodeJS
Я пытаюсь получить результаты из финансового URL-адреса Yahoo:
http://finance.yahoo.com/d/quotes.csv?s=XOM=sn1yr , который возвращает:
"XOM",4:00pm - <b>83.25`</b>`,2.11,13.42
Я пытаюсь сохранить эти результаты в базе данных с...
3956 просмотров
schedule
05.06.2023
XPath соответствует каждому узлу, содержащему текст
Как рекурсивно сопоставить все дочерние узлы, содержащие текст.
Если у меня есть дерево вроде
table
tr
td
"hello"
td
b
"hi"
tr
td
"salud"
td
em
"bonjour"
Как сопоставить каждую строку в узле таблицы с помощью...
1211 просмотров
schedule
28.01.2023
Как я могу очистить данные из текстовой таблицы с помощью Python?
У меня есть следующий текст, и я хотел бы очистить элементы данных и сохранить их в Excel. Есть ли способ сделать это в Python?
text = """
ANNUAL COMPENSATION LONG-TERM COMPENSATION...
1875 просмотров
schedule
20.06.2022
Как очистить описание в результатах поиска Google
Я разрабатываю приложение с использованием vb.net, мое приложение будет выполнять простой поиск в Google с помощью управления веб-браузером, приложение будет очищать результаты Ссылки и их описание, мне удалось очистить ссылку, но я не могу очистить...
936 просмотров
schedule
10.04.2023
PHP очищает HTML между тегами ‹pre›
I'm having trouble with finding out how to scrape HTML content from only inside and tags with PHP5.
Я хочу взять пример следующего документа, взять 2 (или более областей с предварительными тегами, его динамика) и засунуть их в массив....
1394 просмотров
schedule
30.09.2022
PHP очищает изображения из строки - как?
Я новичок в PHP... в любом случае - как мне получить все ссылки на изображения из этой строки? (в массив)
{ "imagedata": { "duration": 4000, "images":{ "image1":{...
242 просмотров
schedule
27.08.2022
Python: правильный URL-адрес для загрузки изображений из Google Image Search
Я пытаюсь получить изображения из поиска изображений Google для определенного запроса. Но на странице, которую я загружаю, нет изображений, и она перенаправляет меня на исходную страницу Google. Вот мой код:
AGENT_ID = "Mozilla/5.0 (X11; Linux...
6922 просмотров
schedule
31.08.2022
Скрапинг данных в Stata
У меня есть 40 000 файлов HTML. В каждом файле есть таблица, содержащая отчет о прибылях и убытках конкретной компании.
Я хотел бы очистить все эти данные в Stata. (Или, как вариант, в файл Excel/CSV). Конечным продуктом должен быть файл...
1744 просмотров
schedule
15.10.2022
Facebook Linter возвращает «Ошибка синтаксического анализа URL-адреса: ошибка синтаксического анализа входного URL-адреса, данные не были извлечены».
facebook возвращает «Ошибка синтаксического анализа URL-адреса: ошибка синтаксического анализа входного URL-адреса, данные не были удалены». когда я использую Facebook Linter. Я уже пытался удалить метатеги, а затем снова вставить их. Я не могу...
1441 просмотров
schedule
17.10.2022
Очистите определенную область содержимого сайта с помощью безопасного входа
Я пытаюсь очистить некоторый конкретный текст веб-сайта, вход в систему которого защищен. Вот учебник по этому вопросу с использованием curl http://www.digeratimarketing.co.uk/2008/12/16/curl-page-сценарийочистки/
Но я не могу реализовать это в...
500 просмотров
schedule
03.07.2023
Как я могу найти и очистить класс с помощью WatiN?
Я использую WatiN и пытаюсь очистить URL-адрес изображения из веб-ссылки на основе класса полей. При просмотре кодов сайтов информация об изображениях отображается следующим образом:
//images code
<div class="doc-banner-icon">
<img...
797 просмотров
schedule
04.05.2023
Beautifulsoup не может извлечь данные, используя attrs=class
Я извлекаю данные для исследовательского проекта и успешно использовал findAll('div', attrs={'class':'someClassName'}) на многих веб-сайтах, но на этом конкретном веб-сайте
Ссылка на веб-сайт
не возвращает никаких значений, когда я...
3593 просмотров
schedule
24.10.2022
Как очищать и виртуально объединять вики-статьи?
Итак, у нашей компании есть большое количество внутренних вики-сайтов для разных отделов, и я ищу способ их объединить. Мы продолжаем пытаться убедить всех использовать одну и ту же вики, но это никогда не срабатывает, они все время хотят создавать...
200 просмотров
schedule
25.07.2022
Извлеките/очистите javascript window.open из статического html-файла, используя php
Я пытаюсь очистить кучу локальных html-файлов. У каждого из них есть фрагмент javascript, встроенный в файл, с другим путем window.open, например:
<script>
function goTo() {
if (document.getElementById('somedomain').checked) {...
914 просмотров
schedule
28.06.2022
Веб-скрейпинг с Nokogiri::HTML и Ruby — проблема вывода в CSV
У меня есть скрипт, который очищает HTML-страницы статей интернет-магазина. Я тестирую набор из 22 страниц, из которых 5 страниц со статьями содержат описание продукта, а остальные — нет.
Этот код выводит правильную информацию на экран:
if...
550 просмотров
schedule
21.05.2022
Парсинг веб-страниц с помощью Nokogiri::HTML и Ruby — сохранение изображений
Я работаю над скриптом для получения данных и изображений со страниц продуктов интернет-магазина (с одобрения владельца)
У меня есть рабочий скрипт, который перебирает CSV-файл с URL-адресами продуктов 20042, чтобы получить нужные мне данные,...
1699 просмотров
schedule
15.06.2022