2012-02-22 9 views
2

私は過去2日間MediaWikiのドキュメントを理解しようとしていましたが、Wikipediaの最初の段落をMediaWiki APIで取得する方法がわかりません。ウィキペディアの記事の最初の段落を取得する

誰かが正しい方向を指すことができますか?

私はfile_get_contentsにアピールするつもりですが、私は確かに「よりクリーンな」解決策があります。

+0

は、あなたが彼らの[サンドボックス](http://en.wikipedia.org/wiki/Special:ApiSandbox)をしようとしてありますか? – yoavmatchulsky

+0

もう一度見てから、ページを表示して最初の段落を取るだけでAPIは必要ありません。 – yoavmatchulsky

答えて

2

file_get_contentsはきれいですが、HTMLコードを取得します。 DOMDocumentを使用してhtmlコードを解析できます。 DOMDocumentはjavascriptとして動作しますが、div内のすべての<p>を取得できます。 または最初のものをつかんでください。例えば

$html = file_get_contents('the url'); 

$dom = new DomDocument(); 
@$dom->loadHTML($html); 

$p = $dom->getElementsByTagName('p')->item(0)->nodeValue; 
関連する問題