ウィキペディアの記事の最初の段落を取得する

私は過去2日間MediaWikiのドキュメントを理解しようとしていましたが、Wikipediaの最初の段落をMediaWiki APIで取得する方法がわかりません。ウィキペディアの記事の最初の段落を取得する

誰かが正しい方向を指すことができますか？

私はfile_get_contentsにアピールするつもりですが、私は確かに「よりクリーンな」解決策があります。

出典

2012-02-22 Russ Ted

は、あなたが彼らの[サンドボックス]（http://en.wikipedia.org/wiki/Special:ApiSandbox）をしようとしてありますか？ – yoavmatchulsky

もう一度見てから、ページを表示して最初の段落を取るだけでAPIは必要ありません。 – yoavmatchulsky

は、クライアントのラッパーを使用する代わりに、生のAPIを使用しないでください。ここから選択する長いリストは、PHPのためにすべての、です：

http://en.wikipedia.org/wiki/Wikipedia:PHP_bot_framework_table

出典

2012-02-23 03:09:00 jpatokal

file_get_contentsはきれいですが、HTMLコードを取得します。 DOMDocumentを使用してhtmlコードを解析できます。 DOMDocumentはjavascriptとして動作しますが、div内のすべての<p>を取得できます。または最初のものをつかんでください。例えば

：

$html = file_get_contents('the url'); 

$dom = new DomDocument(); 
@$dom->loadHTML($html); 

$p = $dom->getElementsByTagName('p')->item(0)->nodeValue;

出典

2012-02-22 06:01:21 xtrimsky

ウィキペディアの記事の最初の段落を取得する

答えて

関連する問題