2011-02-02 15 views
0

どのHTML Webサイトのデータもrdfに変換したいと思います。 html to rdf converterを知っていますか? または、この目的のためにXQueryまたはGRDDLの使用をお勧めしますか?HTML/XMLのWebサイトをRDFに変換する

+0

これは「セマンティックマークアップ」と呼ばれていますか?私は、自動ツールは利用できないと思います。私はSMOREというツールを知っています(Liyang Yuが書いた「セマンティックWebとセマンティックWebサービスの紹介」で紹介されました)。試してみてください:) – Songokute

答えて

4

一般に、HTMLは何かのように表示され、意味するものではないため、自動変換はできません。 HTMLに既存のマークアップが含まれている場合は、Anything2Triples(http://developers.any23.org/)を使用してRDFを取り出すことができます。

HTMLの場合は、何らかの形で独自の抽出ルールを作成する必要があります。 GRDDLは動作しますが、おそらくpython + BeautifulSoupを使うだけです。すでに知っている技術/言語に依存します。

0

HTMLに埋め込みRDFaが含まれている場合は、RDFaパーサーを使用して情報を抽出できます。さまざまなプラットフォームや言語で利用できるパーサーがありますので、開発環境によって異なります。

関連する問題