2012-07-01 5 views
6

私はタイムスタンプを保持するデータベースを持っているといいます。すべてのタイムスタンプ属性について、信頼区間を示す精度属性を追加することがあります。そのため、保存される情報は、たとえば「2012年1月7日12時13分、+/- 3ヶ月」となります。データベースのデータ精度/信頼性をどのようにモデル化すればよいですか?

しかし、一般的には、記録精度/信頼性はあまり簡単ではありません。系譜データベースは、ある人物が別の人物の父親であるという事実を記録する必要があるかもしれません。

さまざまなレベルの精度/信頼度で情報を保存するための一般原則またはベストプラクティスはありますか?

答えて

4

あなたの父親の例では簡単です。誰かが他の誰かの父親であることを100%以上確信することは不可能です。一般的に100%以上の自信を持っていることは不可能です!これは、すべてのデータ属性のパーセント信頼水準を単純に格納できることを意味します。

ただし、信頼水準をパーセンテージで保存したくない場合があります。それはデータ属性そのものと、という意味のに依存します。

たとえば、特定の文字列が他の文字列と比べて「正確」に保存される場合は、代わりにLevenshtein distanceを保存することができます。タイムスタンプの例では、最小値と最大値を個人的に保存しますが、加算または減算する月数も保存できます。どちらかを選択するとデータベースからの計算を迅速に行うことができます。

あなたの質問に対する答えはデータベースに依存せず、その中のデータと、ユーザー、ビジネスなどのニーズに応じて書いています。個々の属性または列にはそれぞれ個のデータが必要です。ソリューション「一般的な」解決策はありません。

関連する問題