2016-07-13 6 views
0

私は現在、銀行業務データウェアハウスを設計し実装するプロジェクトに取り組んでいます。私は会計データマートのデータモデルを定義し、穀粒を定義し、それをモデル化するためにスタースキーマを使用したいと考えています。私は特定ので.....私たちはアカウントためブランチに登録しています顧客 ....(いくつかの他の寸法)の取引に興味があると言われています。しかし、彼らはDAILYを求めています!私は、トランザクションデータベースの正確なレプリカであるため、データウェアハウスに日々のトランザクションを持たせるのは無意味だと私は考えています。このデータウェアハウスは、意思決定者がそのような詳細なデータに没頭していないと私が推測するダッシュボードを作成するために使用されます。どう思いますか ?データモデルグレインを特定する

ありがとうございます。

+0

ハードドライブは安いです。データウェアハウスの重複は良好です。常に最高の穀物である –

+0

@NeilMcGuiganに行ってください。しかし、私たちは毎日のデータに興味がありますか?私はそうだとは思わない – yasmine92

+0

あなたは私の経験の中で事前にすべての質問を考えることはありません。可能な限り最も低い穀物と一緒に行ってください。 – tobi6

答えて

1

はあなたの時間ディメンションの日の穀物を使用して、次のことを考慮してください。

倉庫ではないトランザクションデータベースのレプリカ、同じ情報が両方で利用可能であっても。倉庫は分析用に最適化されており、すべての履歴を含み、不揮発性であり、次元に沿ってデータを集約します。

例では、倉庫には1日以内に発生した多数のトランザクションを表す単一の行があるため、穀物を複製しません。 5年前からトランザクションシステムから削除された情報が含まれている可能性があります。クエリで金額を集計するのは簡単ではないでしょう。それはあなたのトランザクションシステムに負荷をかけません。あなたの会社が別の会社と合併したとき、それはある日、別のトランザクションデータベースからの情報を含むかもしれません。または、顧客情報は、1つまたは複数のソーシャルネットワークからインポートされたデータで強化されてもよい。

重要な点は、倉庫内でトランザクションシステムに重複しているように見える細かいデータがあることを嫌うことではありません。それは有用で一般的です。

+0

詳細な回答をいただきありがとうございます。 – yasmine92

0

次元モデリングの原則は、常に可能な限り最高の粒度でモデル化することです。私は一日未満のトランザクションをモデリングすることは決して考えていないだろうし、時間をかけて試してみることもある(それは別次元かもしれないが)。

+0

私はもっと考えて、あなたがここで何を意味するかを見ます。ありがとうございました! – yasmine92

関連する問題