2017-03-18 15 views
1

私はBallon_d'Or上のWikipediaのページのためのAPIサンドボックスを使用してテーブルを含むウィキペディアのページから、すべてのテキストコンテンツを抽出しようとしています。WikiTablesをWikipediaのページからAPIで抽出するには?

私は与えられた問い合わせてみました:

https://en.wikipedia.org/w/api.php?action=query&format=json&prop=extracts&titles=Ballon_d%27Or&explaintext=1&exsectionformat=wiki 

をが、それはこのようなwikiのテーブルからのコンテンツずにのみ、テキストコンテンツを私に提供:

enter image description here

方法私はあります既に得られているテキスト情報とともに、テキスト形式で表の内容を得ることができますか?

代わりに、私は美しいスープを使用してWebクローリング技術を試すことができますが、私は最初に、クエリメソッドを探したいと思いました。代わりにquery

+1

いいえ、あなたはHTMLパーサのいくつかの種類を使用する必要があります。 – Tgr

答えて

関連する問題