2017-02-23 7 views
0

IはfollowigデータとCSVファイル(小抽出物)を有する:私はまた、私はプロテジェで作成OWL形式のオントロジを有するオントロジーでのクラスの作成を自動化するにはどうすればいいですか?

ITEM_ID FAMILY  SUBFAMILY 
555  Adventure Adventure and extreme sports 
444  Nightlife International restaurants 
333  Adventure Adventure and extreme sports 

を。 FAMILYから "Adventure"、 "Nightlife"など、すべてのクラスが既に作成されている場合は、オントロジーにCSVファイルを読み込むことが可能であることがわかります。 "アドベンチャーとエクストリームスポーツ"、 "インターナショナルレストラン" SUBFAMILYからの等)。これを行うために、SPARQLを使用して項目(ITEM_ID)をインスタンスとしてロードできます。

私はSPARQLとCSVを使ってクラスの作成を自動化することもできますか?この考えは、CSVに格納されたFAMILYとSUBFAMILYに基づいて何千ものクラスを手動で作成することを避けることです。

+2

ツールのリストについては、https://www.w3.org/wiki/ConverterToRdf#CSV_.28Comma-Separated_Values.29を参照し、W3Cの推奨事項https://www.w3.org/TR/csv2rdf/を参照してください。 http://stackoverflow.com/questions/13147864/how-to-create-an-ontology-from-raw-data-csvに関連しています – AKSW

答えて

2

実際にそれを行う方法はたくさんあります。ここで私は、これまで使用してきた夫婦の:RDFと

1. OpenRefineプラグイン

私の好ましい選択肢は Open Refineを使用することです行使する1オフについて

(旧Googleの絞り込み)

インポートすることができますオントロジーを他のものとともに使用し、それらを使用してデータに意味を与えます。ルートノードを選択します。一意のIDを持っていない場合は、追加の列にIDを生成できます。ルートノードをURIとして扱い、それを入力することができます(あなたのオントロジーや他のオントロジーからクラス分けされたものを1つ以上割り当てることができます)。次に、オントロジーのどのプロパティをCSVのヘッダーにマップするかを選択すると、各列のすべてのセルが自動的に表示されます。モデル化したトリプルパターンのオブジェクト、選択したタイプのオブジェクト、URI、テキスト、日付など - いくつかのオプションがあります。次に、RDF/XMLまたはRDF/Turtleとしてエクスポートします。

CSVファイルが非常に大きい場合、Open Refineのメモリを増やすことができます。今のところ、私は列がかなり多いので、CSVを約50万行に変換することができました。その結果、ファイルには膨大な数のトリプルがありました。

しかし、大きなCSVファイルを使用している場合、Protégéはそれらを開かないか、非常に遅く動作します。

2.ヴィルトゥオーゾCSVは、いくつかのオプションがR2RMLだけでなく、Open Data Spacesの使用を含む、そこにあります

spongers。

関連する問題