Вопросы по теме 'jtidy'

Как изменить содержимое тега HTML в Java?
Как я могу изменить HTML-содержимое тега в Java? Например: до: <html> <head> </head> <body> <div>text<div>**text**</div>text</div> </body> </html> после:...
19828 просмотров
schedule 20.05.2024

XPath Как получить значение ячейки таблицы из html-документа
У меня есть html-документ, и где-то внутри документа находится под таблицей, я могу получить строки таблицы и объекты java DOM. Что мне непонятно, так это то, как извлечь значение ячейки таблицы, когда значение является строкой, а также когда это...
7266 просмотров
schedule 15.07.2023

Красивая печать (только отступы) HTML-документы на Java (без JTidy)
Мы генерируем HTML-файлы с помощью универсального шаблонизатора Apache Speed. Сгенерированный HTML выглядит уродливым и не имеет правильного отступа. В моем случае у меня есть HTML, хранящийся в строке, которой я хочу манипулировать таким образом,...
3110 просмотров

Разбор HTML на Android, серьезные проблемы с производительностью
Мне нужно проанализировать около 100 КБ данных HTML, и это просто вызывает огромные проблемы с производительностью на Android. Я пробовал как встроенный XML-парсер, так и JTidy. Встроенный синтаксический анализатор XML дает мне время...
822 просмотров
schedule 26.04.2022

Как добавить новые теги в JTidy?
Я пытаюсь использовать jTidy для извлечения данных из (реального мира) HTML. Но jTidy не анализирует пользовательские теги. <html> <body> <myCustomTag>some text</myCustomTag> <anotherCustom>more...
1274 просмотров
schedule 24.10.2023

Создайте файл mhtml с помощью java
Может ли кто-нибудь предложить, как создать файл mhtml с помощью Java? Я уже использовал jtidy API (sourceforge), но не могу открыть страницу в браузере. Я получаю пустой экран, если открываю файл mhtml в IE. Примечание. Файл (.mhtml) успешно...
888 просмотров
schedule 13.06.2022

Фрагмент форматирования HTML jericho, jTidy или JSoup?
Я хочу отформатировать/сделать отступ фрагмента HTML String html = "<div><p>text1</p></div><div><p>text2</p></div>"; в это <div> <p>text1</p> </div> <div>...
472 просмотров
schedule 08.12.2022

JTidy неправильно обрабатывает некоторые символы
Некоторые символы искажаются после того, как я вызываю Tidy.parse. Два примера: ' вместо ' и ∼ вместо ~ Я предполагаю, что они, должно быть, пришли из Word или чего-то подобного, но приборка очень плохо с ними справляется. В частности, он...
32 просмотров
schedule 30.04.2023