2011-12-07 11 views
-3

ウィキペディアのすべてのインフォボックスのプロパティと値を取得しようとしています(インフォボックスを含むもののみ)。 単純なWebRequestを使用してインフォボックスを解析すると、あまりにも多くのジャンクが発生します。したがって、私はdbpediaを使用し、Jena(SPARQL)を使用してデータを取得することを検討しました。 どうすればいいですか?私にすべてのプロパティをキー値のペアとして与える簡単なクエリはありますか?またはRDFを作成し、必要なものに変換します。ウィキペディアのすべてのプロパティを取得するinfobox(java)

答えて

0

あなたは 実験に使用することができたhttp://dbpedia.org/sparqlでDBpediaのために公共のSPARQLエンドポイントがあります。 http://wiki.dbpedia.org/OnlineAccessに記載されている、クエリを構築するための例とさまざまなツールがあります。データセットをダウンロードして、クエリをローカルで試すこともできます。ただ、明確にする

、RDFはDBpediaのがで公開されているデータ形式である。SPARQLは、RDFを照会するためのクエリ言語です。 Jenaは、RDFデータストアとSPARQLエンジンを含む特定の実装です。

+0

downvoterさんがコメントしますか?あなたが問題を見つけた場合は、答えを改善することを幸せにしてください。 – DNA

関連する問題