dbpedia RDFトリプルからデータベースを作成しようとしています。ウィキペディアのすべてのカテゴリを含むテーブルCategories
があります。私はchild
とparent
フィールド、両方の外部キーCategories
テーブルのテーブルを作成したカテゴリを格納するために。 、スキーマのクエリを最適化するためのより良い方法は... NTriplesからカテゴリをロードするには、次のSQLクエリWikipediaグラフデータベースの挿入
INSERT INTO CatToCat (`child`, `parent`)
values((SELECT id FROM Categories WHERE BINARY identifier='Bar'),
(SELECT id FROM Categories WHERE BINARY identifier='Bar'));
を使用してIAMしかし、挿入が2.5Million関係を挿入することは非常に長い時間がかかるだろう...非常に遅いがあります?
あなたの質問は本当に私には意味がありません。あまり意味のないNTriplesをクエリするのにSQLを使用しているとします。私はあなたがすでにSQLデータベースにインポートされたデータを持っていると仮定します。それはなぜ部分的に質問をするのですか?テーブルをRDF /トリプルストアに入れて、推論を使用して関係を推測するほうがずっと良いでしょう。 – RobV
NTriplesからSQLデータベースにデータをロードしようとしています。私のアプリケーションは、すべてのRDFデータを必要としません。たとえば述語です。私はウィキペディアからこれを直接抽出することができましたが、dbpedia ntダンプからロードする方が速いと思いました。カテゴリ階層が必要です。私はSPARQLなどを使う必要がないので、トリプルストアが過度なものになるかもしれないと思いました。 – z33m
CatToCatテーブルで作成したインデックスのタイプは何ですか? –