Мне нужно разобрать простую HTML-страницу с простой формой. Ответы на подобные вопросы на StackOverflow предлагают использовать одну из множества нестандартных библиотек Java, таких как TagSoup, JSoup, HTMLParser и многие другие.
Однако поиск в Интернете показал, что в Java SE существует некоторая стандартная функциональность через этот класс: http://docs.oracle.com/javase/7/docs/api/javax/swing/text/html/parser/ParserDelegator.html
Мои подвопросы:
- Правда ли, что стандартный класс ParserDelegator может анализировать вариант использования, подобный моему?
- Каковы ограничения стандартной библиотеки, которые создают потребность в таком количестве нестандартных библиотек?
- Препятствует ли тому факту, что ParserDelegator находится в Swing, использовать его на обычном облачном сервере EC2 для веб-приложения? Придется ли мне прыгать через множество обручей, чтобы обойти безголовый аспект, или это будет просто небольшая настройка конфигурации?
- Если стандартный не рекомендуется, то какой нестандартный мне следует использовать, учитывая: (а) мое желание не отходить далеко от стандарта; (б) мой простой вариант использования; (c) стремление к зрелой надежной реализации; и (d) отсутствие ограничений по размеру или весу, поскольку это серверное приложение, а не встроенный клиент. API имеет гораздо более низкий приоритет, поэтому, хотя я ценю селектор CSS JSoup, такой как API, другие проблемы с (a) по (d) переопределяют его.
Спасибо.