私は過去2日間MediaWikiのドキュメントを理解しようとしていましたが、Wikipediaの最初の段落をMediaWiki APIで取得する方法がわかりません。ウィキペディアの記事の最初の段落を取得する
誰かが正しい方向を指すことができますか?
私はfile_get_contentsにアピールするつもりですが、私は確かに「よりクリーンな」解決策があります。
私は過去2日間MediaWikiのドキュメントを理解しようとしていましたが、Wikipediaの最初の段落をMediaWiki APIで取得する方法がわかりません。ウィキペディアの記事の最初の段落を取得する
誰かが正しい方向を指すことができますか?
私はfile_get_contentsにアピールするつもりですが、私は確かに「よりクリーンな」解決策があります。
は、クライアントのラッパーを使用する代わりに、生のAPIを使用しないでください。ここから選択する長いリストは、PHPのためにすべての、です:
http://en.wikipedia.org/wiki/Wikipedia:PHP_bot_framework_table
file_get_contentsはきれいですが、HTMLコードを取得します。 DOMDocumentを使用してhtmlコードを解析できます。 DOMDocumentはjavascriptとして動作しますが、div内のすべての<p>
を取得できます。 または最初のものをつかんでください。例えば
:
$html = file_get_contents('the url');
$dom = new DomDocument();
@$dom->loadHTML($html);
$p = $dom->getElementsByTagName('p')->item(0)->nodeValue;
は、あなたが彼らの[サンドボックス](http://en.wikipedia.org/wiki/Special:ApiSandbox)をしようとしてありますか? – yoavmatchulsky
もう一度見てから、ページを表示して最初の段落を取るだけでAPIは必要ありません。 – yoavmatchulsky