Всем добрый день. Я пытаюсь сохранить HTML-код в базе данных и использую SHEF (Swing HTML Editor Framework), но есть огромная проблема. Обычно сгенерированный HTML выглядит так:
<div>
This is the first paragraph
</div>
<div>
This is the second paragraph.
</div>
<div>
This is the last paragraph.
</div>
Я хочу «очистить» html-код и вместо этого сделать результат таким:
<div>
This is the first paragraph
<br>
This is the second paragraph.
<br>
This is the last paragraph.
</div>
Я пытался использовать HTMLCleaner и JSoup, но я этого не сделал. Я могу заставить JSoup работать так, чтобы
<div>
This is the first paragraph
</div>
<div>
</div>
<div>
This is the last paragraph.
</div>
становится
<div>
This is the first paragraph
</div>
<br>
<div>
This is the last paragraph.
</div>
Это код JSoup, который я использую:
Document source = Jsoup.parse(sourceString);
// For each element
for(Element el: source.select("*")) {
if(el.children().isEmpty() && !el.hasText() && el.isBlock()) {
el.replaceWith(new Element(Tag.valueOf("br"), ""));//replace empty tags with newline
}
}
return source.body().html();
Есть ли способ сделать сгенерированный HTML-код короче? Спасибо!