2016-07-26 10 views
2

"human"(Q5)などの抽象要素のサブクラスのインスタンスを名前でフェッチするクエリを作成しようとしていますが、グラフにトラバースするノードが多すぎます。WikiData Sparqlを使用して抽象要素を効率的にクエリする

  1. これを照会する方法はありますか?私が思いつくのは、Wikidata API search entities endpointを要素名で使用し、Sparqlクエリで必要な結果をフィルタリングして、グラフ全体ではなくクエリのドメインを最小限に抑えることです。
  2. Wikidata Sparqlはベータ版であるため、この方法を運用環境で使用することについて少し気になります。知識ベースグラフのユースケースをフリーズから移行するためのベストプラクティスは? FreebaseからWikidataへのデータ移行に関する更新はありますか?

最後に、廃止予定のFreebaseサービスの代わりに成熟した代替手段はありますか?

+0

実稼働環境では、独自のSPARQLエンドポイントを使用し、その中にWikidataをロードします。それ以外のものは、その可用性を何もコントロールしていないので意味をなさない。 – AKSW

+0

外部生産サービスの代替品はありませんか?社内ウィキデータミラーを維持することは、私がこのサービスから必要な範囲では意味をなさない。 –

+0

「外部」生産とはどういう意味ですか?実際には、公開SPARQLエンドポイントを使用することはできますが、無料でホストされており、取得したものについては何も支払う必要はありません。したがって、あなたは何らかの主張をすることはできません。そのようなサービスをホスティングするにはお金がかかります。あなたはそれを使用する唯一の人ではありません。さらに、サービスをホストするために使用するハードウェアに依存する必要があるため、速度を向上させることはできません。 – AKSW

答えて

2

どのエンドポイントに対して照会していますか?実動サービスに対してSLA(ベータか否定)のない共有の公開エンドポイントに対して照会することは、非常に危険な命題です。

Wikidataは完全なデータベースダンプを提供しており、あなたが好きなインフラストラクチャに合わせて、サブセット化してロードすることができます。これにより、パフォーマンス、品質、およびその他の重要なメトリックを完全に制御することができます。

Freebaseから移行する限り、移行パスはありません。トレインがオンだったトラックは終了しています(少なくともGoogle以外の外部のユーザーの場合)。それは単に非難されただけではなく、ずっと前に完全に閉鎖されました。データのほんの一部はWikidataにインポートされました(そしてそれらは共通の先祖Wikipediaのために共通の束を共有していました)が、MQLのJSONクエリベースの例、Freebase Search、Freebase Suggest、Google規模のパフォーマンスや可用性などが利用可能です(まだ?)Wikidata。

データが重要な場合は、ニーズに合ったインフラストラクチャを使用して自己ホストする必要があります。

+0

私はhttps://query.wikidata.org/sparqlエンドポイントを使用しています。社内ウィキダータを維持すると、データを常に更新するオーバーヘッドが発生します。 より広いデータでWikidataより優れた選択肢がありますか?おそらくGoogleナレッジグラフはより包括的で信頼性の高い代替手段ですか? また、指定した名前のすべての人間を照会するために使用した方法についての洞察はありますか? –

関連する問題