Я пытаюсь очистить вики-путешествие для конкретных данных. например, климат, получение и т. д. Мне удалось получить от них xml со специальным экспортом.
http://wikitravel.org/en/Special:Export/San_Francisco Я получил данные в форме xml, но это в вики-разметке, и я попытался найти решение, чтобы получить этот текст, но не смог найти подходящего решения.
Я попытался написать функцию php с регулярными выражениями, чтобы я мог преобразовать ее в html, но она преобразуется неоднородным образом, поэтому очень сложно выбрать конкретные данные.
Также попытался написать URL-адрес mediawiki, чтобы я мог что-то запрограммировать http://wikitravel.org/en/api.php?format=xml&action=query&titles=Main%20Page&prop=revisions&rvprop=content Но это не работает.
Не могли бы вы помочь мне с этим? Кто-нибудь успешно очистил википедию. У меня есть учебник или любая другая техника, на которую я могу сослаться.