Публикации по теме 'jsoup'


Как использовать Jsoup для очистки веб-страниц (Учебник)
Это руководство является очень базовым, но Jsoup - отличная библиотека, с которой должны быть знакомы все, от стажеров до старших разработчиков. Что такое Jsoup? Jsoup - это библиотека Java для работы с реальным HTML. Он предоставляет очень удобный API для извлечения данных и управления ими с использованием лучших методов, подобных DOM, CSS и jquery. Или, другими словами, это библиотека Java, которая позволяет очищать или извлекать указанную информацию с веб-сайтов с помощью..

Вопросы по теме 'jsoup'

Преобразование HTML в обычный текст в Java
Мне нужно преобразовать HTML в обычный текст. Единственное мое требование к форматированию - сохранить новые строки в простом тексте. Новые строки должны отображаться не только в случае <br> , но и в других тегах, например <tr/> ,...
46861 просмотров
schedule 16.02.2023

Jsoup — проблема с выбором тега
Есть ли способ выбрать элемент, следующий за другим? Например, если у меня есть: <table> <tr> <th></th> <td></td> </tr> <tr> ... </tr> </table>...
1611 просмотров
schedule 04.06.2022

Если Jsoup работает с Android?
Мне нужно анализировать данные из Интернета в моем приложении для Android. Среди многих решений я нахожу Jsoup более простым и понятным. Но я не могу использовать его в своем приложении. Если кто-нибудь разделит идею, это будет здорово, спасибо
1667 просмотров
schedule 02.08.2022

jsoup кавычки и пробелы
Я пытаюсь выбрать с помощью Jsoup абзац внутри следующего фрагмента HTML: <div class="abc "> <p class="de">Very short paragraph.</p> </div> Для этого я использую следующий фрагмент кода Java: Elements divs =...
3597 просмотров
schedule 03.05.2023

Как использовать JSOUP в Android?
Я хочу разобрать html-страницу с этим кодом ‹ span class = bld >1.2456 RON ‹ /span > Я хочу получить текст «1.2456 RON» с SOUP в Android. Что я буду делать? Скажи мне, пожалуйста
1404 просмотров
schedule 12.07.2022

Разобрать xml с помощью java и сохранить теги html
У меня есть xml, который я анализирую и получаю данные между узлами. Однако эти данные окружены тегами html. я создаю другой xml и помещаю в него эти данные. Теперь мне нужно снова разобрать его, чтобы получить правильный синтаксис html....
3994 просмотров
schedule 21.12.2023

Разбор строки и сбор элементов HTML с разными идентификаторами
Я передал содержимое HTML в строку sayHtml_content. Мне нужно проанализировать строку Html_content и выбрать несколько тегов DIV, используя там идентификатор, скажем, например, fullHeader - это идентификатор DIV, мне нужно выбрать контент, который...
477 просмотров
schedule 26.01.2023

JSoup: замена строки добавляет новые строки
У меня следующая проблема с JSoup. Я хочу разобрать и изменить следующий HTML-код: <code> <style type="text/css" media="all"> @import url("http://hakkon-aetterni.at/modules/system/system.base.css?ll3lgd"); @import...
1540 просмотров
schedule 11.05.2023

JSoup 1.6.0 на Android выдает исключение: String.isEmpty() NoSuchMethodExists
Я пытаюсь использовать JSoup 1.6.0 со своим приложением для Android, и оно выдает исключение NoSuchMethodExists. Этот другой вопрос говорит мне, что isEmpty() не добавлялся в Java JRE до версии 1.6 - - Я проверил свою JRE в eclipse, и это 1.6,...
1462 просмотров
schedule 15.11.2022

Android Не удалось найти метод
Я пытаюсь запустить код на Android, который использует внешнюю библиотеку JSoup. Я добавляю требуемую банку в свой путь сборки, и Eclipse показывает, что ошибок нет. Когда я пытаюсь запустить программу на Android, я получаю эту ошибку в LogCat....
2880 просмотров
schedule 20.03.2024

Jsoup SocketTimeoutException: время ожидания истекло
Я получаю SocketTimeoutException , когда пытаюсь проанализировать множество HTML-документов с помощью Jsoup. Например, у меня есть список ссылок: <a href="www.domain.com/url1.html">link1</a> <a...
62293 просмотров
schedule 11.06.2022

Как отправить текст через формы с помощью JSoup
Я хотел бы отправить текст в эту форму с помощью JSoup. Как мне это сделать? <form id="quickpostform" action="" method="post" style="display: block; text-align: center; "> <input type="hidden" name="action" value="reply"/> <input...
15333 просмотров
schedule 18.06.2023

Как преобразовать документ, созданный в Jsoup (парсер Java html), в строку
У меня есть документ, сделанный в jsoup, который выглядит так Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); Как мне преобразовать это doc в строку.
26534 просмотров
schedule 02.12.2022

Почему символы UTF-8 не отображаются правильно на этой веб-странице (сгенерированной с помощью JSoup)?
У меня возникают проблемы с наборами символов при анализе и отображении страницы с использованием библиотеки JSoup. вот пример страницы, которую он отображает: http://dl.dropbox.com/u/13093/charset-problem.html Как видите, где должны быть...
1364 просмотров
schedule 14.07.2022

Как избежать принудительного закрытия с помощью IOException и SocketTimeoutException JSoup?
Я использую этот код для извлечения html-страницы и ее анализа. while(doc == null && retry<5){ retry++; try { doc = Jsoup.connect(url).get(); } catch (IOException e) {...
1173 просмотров
schedule 27.04.2023

JSoup: запрос ответа JSON
Я использую JSoup для аутентификации, а затем подключаюсь к веб-сайту. Некоторые URL-адреса имеют ответ JSON (потому что часть сайта находится в AJAX). Может ли JSoup обрабатывать ответ JSON? Connection.Response doc = Jsoup.connect("...")...
32559 просмотров
schedule 20.10.2022

Файлы cookie Jsoup для очистки HTTPS
Я экспериментирую с этим сайтом, чтобы собрать свое имя пользователя на странице приветствия, чтобы изучить Jsoup и Android. Используя следующий код Connection.Response res = Jsoup.connect("http://www.mikeportnoy.com/forum/login.aspx")...
32264 просмотров
schedule 18.02.2022

Отправка запроса POST с именем пользователя и паролем и сохранением файла cookie сеанса
Как я могу сохранить файлы cookie с помощью Jsoup после отправки запроса POST с именем пользователя и паролем? Или я должен сначала предоставить их объекту подключения, а затем сохранить?
10379 просмотров
schedule 26.02.2023

Селектор Jsoup:eq(n)
У меня есть страница test.htm: <html> <body> <div class="partA"> 1 </div> <div class="partB"> 2 </div> <div class="partC"> 3 </div> <div class="partB">...
2492 просмотров
schedule 14.11.2023

Как разобрать источник изображения с помощью JSOUP?my
Я пытаюсь разобрать этот контент с помощью jsoup. <div class="imageInlineCenter" style="width: 468px;" align="center"><img src="http://xbox360media.ign.com/xbox360/image/article/117/1171345/MW3 try { jsDoc =...
10307 просмотров
schedule 26.08.2022