ドキュメントストレージのソリューションを構築しています。ドキュメントやタイトルのような基本データから関連イベントの日付まで、または各国の規制に準拠するために多数の追加メタデータを保存する必要があります。処分と分類のルール。エンティティメタデータストレージアーキテクチャ
私はソリューションのさまざまな種類を見てきましたが、どれも私を説得しない:新しいメタデータスロットが追加されます(そう、彼らは文書に関連付けられたメタデータと同じ数の列を持っている)とき、列に成長
- テーブル
- 多くのスペアの汎用列を持つ表。 1に非常に似ていますが、テーブルが拡大しません(許可が少ない)
- 文書ID、メタデータキー、およびメタデータ値の表。
- 3のメタデータ定義とメタデータキーを持つテーブルは、メタデータIDで置き換えられます。過去にこのソリューションを使用しました。テーブルの最後には何百万もの行があります。
- すべてのメタデータがキーと値のペアになっているXMLまたはその他の構造化された情報を格納する、ドキュメントテーブルまたは関連するテーブルのテキストフィールド。
関連するメタデータで検索するためのパラレルフルテキストインデックス(Lucene.Net?Other?)を提供しています(すべてを「検索可能」にする必要はありません)。
提案がありますか?同様の経験ですか?
はい、2番は普及していますが(Sharepoint)、私はあなたに同意しますが、厄介な解決策です。 –
私はこれを回答として受け入れます。ナンバー4はHarperの提案であり、RDBMSの観点からは良い解決策です。私は関連するメタデータを扱う索引と検索エンジンとを(私たちが実際に持っているものを)ミックスすると思います。 –