Я хочу разобрать Html и получить результат в виде строки. Учитывая, что тело внешнего HTML-кода содержит другую строку Html, я хочу, чтобы этот внутренний HTML-код был выходной строкой.
Пример> Ввод HTML:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html><head></head><body><p><!DOCTYPE html><br /><html><br /><body><br /><br /><h1>My First Heading</h1><br /><br /><p>My first paragraph.</p><br /><br /></body><br /></html><br /><br /></p></body></html>
Выходная строка:
<!DOCTYPE html><html><body><h1>My First Heading</h1><p>My first paragraph.</p></body></html>
Важно: я использую редактор HTML, в котором, если я что-то ввожу, он возвращает HTML-представление для этого ввода при выполнении getText, первая строка Html выше — это только это представление.
Также выходная строка должна быть такой же, как при запуске первой строки здесь (http://www.w3schools.com/html/tryit.asp?filename=tryhtml_basic)
Пожалуйста, помогите мне с этим.