Вопросы по теме 'jericho-html-parser'

Как получить текст и другие теги между определенными тегами с помощью HTML-парсера Jericho?
У меня есть файл HTML, который содержит определенный тег, например. <TABLE cellspacing=0> и конечный тег </TABLE> . Теперь я хочу получить все между этими тегами. Я использую HTML-парсер Jericho на Java для анализа HTML. Можно ли...
8308 просмотров
schedule 15.07.2022

Получить конкретное слово в тексте на HTML-странице
Если у меня есть следующая HTML-страница <div> <p> Hello world! </p> <p> <a href="example.com"> Hello and Hello again this is an example</a></p> </div> Я хочу получить конкретное слово,...
401 просмотров

Красивая печать (только отступы) HTML-документы на Java (без JTidy)
Мы генерируем HTML-файлы с помощью универсального шаблонизатора Apache Speed. Сгенерированный HTML выглядит уродливым и не имеет правильного отступа. В моем случае у меня есть HTML, хранящийся в строке, которой я хочу манипулировать таким образом,...
3110 просмотров

Разобрать указанный текст со страницы с помощью парсера jericho html
У меня проблемы с извлечением указанного текста со страницы. В качестве примера я использую Сводка патентообладателя Если вы зайдете на сайт, то увидите, что там есть «Всего: 82» (это количество обращений по критерию SASA). Мне нужно получить...
346 просмотров
schedule 13.05.2023

Преобразуйте итератор в цикл for с индексом, чтобы пропускать объекты
Я использую Jericho HTML Parser для разбора некорректного HTML-кода. В частности, я пытаюсь получить все текстовые узлы, обработать текст и затем заменить его. Я хочу пропустить определенные элементы из обработки. Например, я хочу пропустить...
350 просмотров
schedule 22.07.2023

Извлечение текста из HTML с использованием Java, включая номер исходной строки и код
Вопрос о том, как извлечь текст из HTML с помощью Java, просматривался и дублировался миллион раз: Извлечение текста из HTML Java Благодаря ответам, найденным в Stackoverflow, мое текущее положение дел таково, что я использую JSoup...
2189 просмотров

Как разобрать Html и получить результат в виде строки с помощью Java
Я хочу разобрать Html и получить результат в виде строки. Учитывая, что тело внешнего HTML-кода содержит другую строку Html, я хочу, чтобы этот внутренний HTML-код был выходной строкой. Пример> Ввод HTML: <!DOCTYPE html PUBLIC "-//W3C//DTD...
420 просмотров

Фрагмент форматирования HTML jericho, jTidy или JSoup?
Я хочу отформатировать/сделать отступ фрагмента HTML String html = "<div><p>text1</p></div><div><p>text2</p></div>"; в это <div> <p>text1</p> </div> <div>...
472 просмотров
schedule 08.12.2022