Получить первый абзац статьи из Википедии

Я пытался понять документацию MediaWiki последние два дня и не могу понять, как получить первый абзац статьи из Википедии через MediaWiki API.

Может ли кто-нибудь указать мне правильное направление?

Я собираюсь обратиться к file_get_contents, но уверен, что есть более «чистое» решение.


person Russ Ted    schedule 22.02.2012    source источник
comment
пробовали ли вы их песочницу?   -  person yoavmatchulsky    schedule 22.02.2012
comment
Посмотрев еще раз, вам не понадобится API, чтобы просто просмотреть страницу и взять первый абзац.   -  person yoavmatchulsky    schedule 22.02.2012


Ответы (2)


Не пытайтесь использовать необработанный API, вместо этого используйте клиентскую оболочку. Вот длинный список на выбор, все для PHP:

http://en.wikipedia.org/wiki/Wikipedia:PHP_bot_framework_table

person lambshaanxy    schedule 23.02.2012

file_get_contents довольно чистый, вы получаете HTML-код. Затем вы можете проанализировать html-код с помощью DOMDocument. DOMDocument работает как javascript, например, вы можете получить все <p> в div. Или возьмите первую.

Например:

$html = file_get_contents('the url');

$dom = new DomDocument();
@$dom->loadHTML($html);

$p = $dom->getElementsByTagName('p')->item(0)->nodeValue;
person Andrei    schedule 22.02.2012