Я использую openhtmltopdf для преобразования html в pdf. В настоящее время я получаю исключение, если html содержит немецкие символы, например, ä, ö, ü.
PdfRendererBuilder builder = new PdfRendererBuilder();
builder.useFastMode();
builder.withHtmlContent(html,"file://localhost/");
builder.toStream(out);
builder.run();
org.xml.sax.SAXParseException; номер строки: 17; номер столбца: 31; Сущность "auml" упоминалась, но не объявлялась.
Вот мой html:
<html>
<head>
<meta charset="UTF-8" />
</head>
<body>
käse
</body>
</html>
Экспортируемое слово - «касе» (сыр).
ОБНОВИТЬ
Я пробовал с распознавателем сущностей таким образом:
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=null;
try{
builder=factory.newDocumentBuilder();
ByteArrayInputStream input=new ByteArrayInputStream(html.getBytes("UTF-8"));
builder.setEntityResolver(FSEntityResolver.instance());
org.w3c.dom.Document doc=builder.parse(input);
}catch(Exception e){
logger.error(e.getMessage(),e);
}
но я все еще получаю то же исключение при "разборе".
<meta charset="utf-8">
в вашем HTML-документе, где вы хотите создать PDF? - person Norbert Bartko   schedule 09.03.2020