Вопросы по теме 'jericho-html-parser'
Как получить текст и другие теги между определенными тегами с помощью HTML-парсера Jericho?
У меня есть файл HTML, который содержит определенный тег, например. <TABLE cellspacing=0> и конечный тег </TABLE> . Теперь я хочу получить все между этими тегами. Я использую HTML-парсер Jericho на Java для анализа HTML. Можно ли...
8308 просмотров
schedule
15.07.2022
Получить конкретное слово в тексте на HTML-странице
Если у меня есть следующая HTML-страница
<div>
<p>
Hello world!
</p>
<p> <a href="example.com"> Hello and Hello again this is an example</a></p>
</div>
Я хочу получить конкретное слово,...
401 просмотров
schedule
23.12.2022
Красивая печать (только отступы) HTML-документы на Java (без JTidy)
Мы генерируем HTML-файлы с помощью универсального шаблонизатора Apache Speed. Сгенерированный HTML выглядит уродливым и не имеет правильного отступа.
В моем случае у меня есть HTML, хранящийся в строке, которой я хочу манипулировать таким образом,...
3110 просмотров
schedule
22.05.2022
Разобрать указанный текст со страницы с помощью парсера jericho html
У меня проблемы с извлечением указанного текста со страницы. В качестве примера я использую Сводка патентообладателя
Если вы зайдете на сайт, то увидите, что там есть «Всего: 82» (это количество обращений по критерию SASA). Мне нужно получить...
346 просмотров
schedule
13.05.2023
Преобразуйте итератор в цикл for с индексом, чтобы пропускать объекты
Я использую Jericho HTML Parser для разбора некорректного HTML-кода. В частности, я пытаюсь получить все текстовые узлы, обработать текст и затем заменить его.
Я хочу пропустить определенные элементы из обработки. Например, я хочу пропустить...
350 просмотров
schedule
22.07.2023
Извлечение текста из HTML с использованием Java, включая номер исходной строки и код
Вопрос о том, как извлечь текст из HTML с помощью Java, просматривался и дублировался миллион раз: Извлечение текста из HTML Java
Благодаря ответам, найденным в Stackoverflow, мое текущее положение дел таково, что я использую JSoup...
2189 просмотров
schedule
16.06.2023
Как разобрать Html и получить результат в виде строки с помощью Java
Я хочу разобрать Html и получить результат в виде строки. Учитывая, что тело внешнего HTML-кода содержит другую строку Html, я хочу, чтобы этот внутренний HTML-код был выходной строкой.
Пример> Ввод HTML:
<!DOCTYPE html PUBLIC "-//W3C//DTD...
420 просмотров
schedule
02.04.2023
Фрагмент форматирования HTML jericho, jTidy или JSoup?
Я хочу отформатировать/сделать отступ фрагмента HTML
String html = "<div><p>text1</p></div><div><p>text2</p></div>";
в это
<div>
<p>text1</p>
</div>
<div>...
472 просмотров
schedule
08.12.2022