2016-08-26 27 views
0

これは本当に基本的な質問のようですが、何らかの理由でこれを理解できません。私はhereからDBpedia 2014フクロウファイルを持っています。今度はこれをProtégéにロードしてオントロジーメトリックタブを見ると、クラス数は814、オブジェクトプロパティ数は1310、データプロパティ数は1725です。これは正しい数ですか?好奇心から、私はヴィルトゥオーゾのエンドポイントで、クエリのプロパティと、彼らがグラフで表示された回数の合計を見つけようとしてDBpediaのクラスとプロパティの総数

select ?p (count(?p) as ?totalCount) where {?s ?p ?o } group by ?p order by DESC(?totalCount) 

すなわちのための番号を確認してみました、私は、合計が10,000であることがわかります。今は、これがプロパティとグラフに表示される回数をチェックする正しい方法であるかどうかはわかりません。

SELECT ?class 
WHERE { 
    ?class rdf:type rdfs:Class. 
} 

が、私はまったくの結果を得ることはありません:私はこのクエリを発行するクラスの場合

。今のVirtuosoすなわち

Select count(distinct ?Concept) where {[] a ?Concept} 

にデフォルトのクエリを使用して、私は、だから私は少し混乱しています369857.として値を取得します。グラフはyago、umbel、schema.org、purlのコンセプトを持っているか、間違って何かを見ていますか?概念はクラスとはまったく異なっていますか? (私は考えていない、異なって解釈される)。インクルードは、トリプルパターンのために、被写体の選択はRは1/R、であると言う、私はここでは、このpaper

で定義された選択性を計算するためにそれらを必要なので、今正直に、私はこれらの数字でwaylaidしまった

リソースの数なので、リソースはクラス数または概念数を意味しますか?または?s ?p ?ocount of ?sです。トリプルパターン?

答えて

2

DBpediaオントロジには、名前空間http://dbpedia.org/ontologyを持つクラスとプロパティの公理が含まれています。

まず、それは名前空間http://dbpedia.org/propertyを持っている性質を持つトリプルを含んでいます

DBpediaのSPARQLエンドポイント

は、より多くのデータが含まれています。これらのプロパティは型なしです(つまりタイプ rdf:Property)。これは実際には値がリソースまたはリテラルの両方になることを意味します。OWLでは、オブジェクトとデータのプロパティなどの型付きプロパティがあります。

SPARQLエンドポイントは、あなたがここに[1][2]詳細を見つけることができます。、中でも、YAGOまたは上位オントロジー散形花序のような外部のデータセットへのリンクです。

ところで、あなたはあなたの最初のクエリから簡単にそれを見ることができます。そこ

最初のクエリによれば、それは正しいクエリです。各プロパティのトリプルの数これは、DBpediaがロードされているVirtuosoトリプルストアのデフォルトの結果セット制限であるため、10000を返します。より多くの結果を得るには、ページネーションを使用する必要があります。トリプルで使用されるプロパティの合計数は、DBpediaのにはクラスは、その型のではありませんので、タイプrdf:Classのすべてのクラスと

SELECT (COUNT(DISTINCT ?p) AS ?cnt) 
WHERE 
    { ?s ?p ?o} 

あなたの2番目のクエリは何も返さないと見つけることができます。OWLオントロジーのタイプowl:Classのクラスを照会する方が一般的です。 3番目のクエリは、実際にオブジェクトの位置にあるrdf:typeトリプルで発生したすべてのリソースを返します。これは、インスタンスデータで動作すると少し異なります。つまり、データで実際に使用されているすべてのクラスが返されます。

最後の質問です。私はこの論文を読んでいませんが、多くの研究論文の共通の基準はしばしば、特定の財産を使用する別個の主題を使用することです。

+0

この質問への返信に感謝してくれてありがとう@AKSW。本当に役に立ちました! – N00bsie