Как извлечь текст внутри тегов в htmlcleaner или jSoup

Я новичок в разработке Android, не могу понять основы HtmlCleaner или jSoup.

У меня есть страница, например.

<html><body>
....(large code here)....
<b>Hello World! </b> 
....(large code here)....
</body> </html>

Как я могу извлечь слова из тегов <b>..</b>?


person Groosha    schedule 03.02.2013    source источник


Ответы (2)


Если вы пытаетесь использовать Jsoup, это должно быть довольно просто

Document doc = Jsoup.connect("http://www.w3schools.com/tags/tag_b.asp").get();
Element firstBoldElement = doc.select("b").first();
System.out.println("Bold Text is : "+firstBoldElement.text());

Вам нужно будет добавить правильную обработку исключений в приведенный выше код.

person coderplus    schedule 03.02.2013
comment
Работал как шарм! Спасибо! - person Groosha; 04.02.2013

Использование jSoup. Извините за ошибки, пишу по памяти.

Document doc = Jsoup.parse(pageString);
Elements eles = doc.getElementsByTag("b");
for(int i = 0; i < eles.size(); i++)
{
    System.out.println(eles.get(i).text());
}
person Aelexe    schedule 03.02.2013
comment
Это тоже очень мило. Спасибо! - person Groosha; 04.02.2013