2017-04-13 5 views
1

wikiより、データ系列とデータプロバンスの違いは何ですか?

データ系統は、データの起源を含み、経時的に移動するデータライフサイクルとして定義されます。それは、さまざまなプロセスを経てデータがどのようになるかを記述します。アナリティックパイプラインの可視性を提供し、ソースへのエラーのトレースを簡略化します。

データ源は、実際にデータとその起源の履歴レコードを提供する、関心のあるデータに影響する入力、エンティティ、システム、およびプロセスを文書化します。

どちらの概念もデータの出所について話しているようですが、その違いについてはまだ混乱しています。両方の概念は同じですか?それらが異なる場合、誰かが例を共有することができますか?

おかげで、私たちの経験から

+1

これはおそらく同じことです。以前はデータの出所について聞いたことがなかった。データの出所について読んだ後では、単一のデータよりも文書への影響を追跡する方が重要ですが、データ系列はレコードの特定の列に明示的なソースと変換のリストを持つデータウェアハウスに関連していますたとえば、元のシステム(総勘定元帳)と計算(このアカウント+そのアカウント)について説明してください。 –

答えて

3

は、データ出所は、ビジネスユーザーのためのシステムの唯一のハイレベルのビューが含まれているので、そのデータがどこから来た彼らは、大まかに移動することができます。さまざまなモデリングツールや単純なカスタムテーブルとチャートによって提供されています。 データ系は、より具体的な用語であり、ビジネス(データ)系統と技術系(データ)系統の2つの側面を含む。ビジネス系列の画像データはビジネス用語レベルで流れ、Collibra、Alationなどのソリューションによって提供されます。テクニカルデータ系列は、実際の技術メタデータから作成され、実際の表、スクリプト、およびステートメントの最下位レベルのデータフローを追跡します。技術データ系列は、MANTAやInformatica Metadata Managerなどのソリューションによって提供されています。

関連する問題