2009-06-15 8 views
4

私はデータを保存するためのフリーベースプロジェクトを見てきました。名前、場所、日付などの具体的で客観的なデータを保存するのに最適な場所です。意見や評価などの主観的なデータを保存するのに適していますか?この種の情報を保存したり問い合わせたりするための、よりオープンなデータ、セマンティックデータストアまたは戦略がありますか?セマンティックWebでの主観的なデータのマッピング方法は?

また、主観的であるため、他の人が自分の意見に同意しないことを確信できます。どのように私は他人の意見をインラインで保存して群衆の意見をよりよく表現できるでしょうか?

freebaseはこのタイプのデータを保存するのに適していますか?

たとえば、レストランの評価または映画の評価。映画の評価はおそらくレストランの評価よりも時間の影響を受けにくいでしょう。データを入力した人に関する非識別情報は、他の要因および関係を決定するのに興味深いものです。

答えて

0

データはデータです。データには、それが何であるか、意見または評価としてラベル付けされています。そのようなデータから推測できる「事実」は、ほとんどの人がこのトピックに関する主観的意見を持っているということでしょう。

+0

ありがとう! 意味がありますが、私は実際にfreebaseがそのデータを保存するのに最適かどうかを知りたいと思います。ウィキペディアのように映画のレビューに最適な場所ではないかもしれませんが、freebaseはそのデータのための最良の場所ではないかもしれません... また、主観的なデータは、ロケール、時間、性別、年齢などの複数の要因によって異なる可能性があります。単純なカウントまたはパーセンテージは、集まった意見の完全な画像をキャプチャできません。応答のために –

1

データフォーマットの設計/選択は、そのデータを使用して質問する質問を理解していないと難しいです。データの使用目的はどのようなものですか?いくつかのユースケースがあり、それがあなたの検索を導くかもしれません。

帰属データの保存は公開された研究テーマであり、インテリジェンスコミュニティが(他の場所でも)開発されています。これらのユーザーは明らかに情報がどこから来たのか、途中で追加されたのかシークレット情報が偶然に含まれているかどうかを追跡するようなことをすることができます。それは見て良い場所かもしれません。 Twitterから

+0

ありがとう。私はシンプルなユースケースを2つ追加しました(ムービー/ restauerantレビュー)。私は自分自身のリレーショナルデータベースを構築することができましたが、私のモチベーションはオープンで再利用可能な形式で行うことです。 –

2

セマンティックWebは、大部分は一階述語論理の多かれ少なかれバリアント、なので、重要な部分は何のそれぞれの明確な理解を持つことですあなたの述語は "意味"です。この考え方は非常に単純ですが、多種多様な意味表現に適用できます。つまり、データベースのエンティティモデルの背後にあります。

セマンティックWeb表現で言及した情報を表すのに問題はありません。あなたの述語のそれぞれが何を表しているのかを明確に定義しておき、時間の経過とともにその意味が変わらず、一貫性のない表現で終わるようにしてください。

Geneserethの本は古いですが、これについて詳しく読むことに興味がある場合は、いいです。私はSemantic Webで働いていた多くの人がDouglas LenatのCycプロジェクトに参加していたと思っています。これは徐々にロジックベースの意味表現に移行しています。

http://www.amazon.com/Logical-Foundations-Artificial-Intelligence-Genesereth/dp/0934613311

はCycのためのサイト:返信用

http://www.cyc.com/

+0

ありがとう、私は本をチェックアウトします。 –