Вопросы по теме 'jtidy'
Как изменить содержимое тега HTML в Java?
Как я могу изменить HTML-содержимое тега в Java? Например:
до:
<html>
<head>
</head>
<body>
<div>text<div>**text**</div>text</div>
</body>
</html>
после:...
19828 просмотров
schedule
20.05.2024
XPath Как получить значение ячейки таблицы из html-документа
У меня есть html-документ, и где-то внутри документа находится под таблицей, я могу получить строки таблицы и объекты java DOM. Что мне непонятно, так это то, как извлечь значение ячейки таблицы, когда значение является строкой, а также когда это...
7266 просмотров
schedule
15.07.2023
Красивая печать (только отступы) HTML-документы на Java (без JTidy)
Мы генерируем HTML-файлы с помощью универсального шаблонизатора Apache Speed. Сгенерированный HTML выглядит уродливым и не имеет правильного отступа.
В моем случае у меня есть HTML, хранящийся в строке, которой я хочу манипулировать таким образом,...
3110 просмотров
schedule
22.05.2022
Разбор HTML на Android, серьезные проблемы с производительностью
Мне нужно проанализировать около 100 КБ данных HTML, и это просто вызывает огромные проблемы с производительностью на Android. Я пробовал как встроенный XML-парсер, так и JTidy.
Встроенный синтаксический анализатор XML дает мне время...
822 просмотров
schedule
26.04.2022
Как добавить новые теги в JTidy?
Я пытаюсь использовать jTidy для извлечения данных из (реального мира) HTML. Но jTidy не анализирует пользовательские теги.
<html>
<body>
<myCustomTag>some text</myCustomTag>
<anotherCustom>more...
1274 просмотров
schedule
24.10.2023
Создайте файл mhtml с помощью java
Может ли кто-нибудь предложить, как создать файл mhtml с помощью Java? Я уже использовал jtidy API (sourceforge), но не могу открыть страницу в браузере. Я получаю пустой экран, если открываю файл mhtml в IE.
Примечание. Файл (.mhtml) успешно...
888 просмотров
schedule
13.06.2022
Фрагмент форматирования HTML jericho, jTidy или JSoup?
Я хочу отформатировать/сделать отступ фрагмента HTML
String html = "<div><p>text1</p></div><div><p>text2</p></div>";
в это
<div>
<p>text1</p>
</div>
<div>...
472 просмотров
schedule
08.12.2022
JTidy неправильно обрабатывает некоторые символы
Некоторые символы искажаются после того, как я вызываю Tidy.parse. Два примера: ' вместо ' и ∼ вместо ~
Я предполагаю, что они, должно быть, пришли из Word или чего-то подобного, но приборка очень плохо с ними справляется. В частности, он...
32 просмотров
schedule
30.04.2023