Я пытаюсь найти инструмент для анализа файла TXT, содержащего html, в обычный текст, сохраняя при этом его форматирование, списки и т.д.
Мне удалось найти этот http://jsoup.org/apidocs/org/jsoup/examples/HtmlToPlainText.html, который отлично работает. Единственная проблема в том, что он читает URL, а не файл. Я пытался внести некоторые изменения в код, но безуспешно
Может ли кто-нибудь указать мне правильное направление, как заставить его читать мой текстовый файл в качестве входных данных?