wikiより、データ系列とデータプロバンスの違いは何ですか?
データ系統は、データの起源を含み、経時的に移動するデータライフサイクルとして定義されます。それは、さまざまなプロセスを経てデータがどのようになるかを記述します。アナリティックパイプラインの可視性を提供し、ソースへのエラーのトレースを簡略化します。
データ源は、実際にデータとその起源の履歴レコードを提供する、関心のあるデータに影響する入力、エンティティ、システム、およびプロセスを文書化します。
どちらの概念もデータの出所について話しているようですが、その違いについてはまだ混乱しています。両方の概念は同じですか?それらが異なる場合、誰かが例を共有することができますか?
おかげで、私たちの経験から
これはおそらく同じことです。以前はデータの出所について聞いたことがなかった。データの出所について読んだ後では、単一のデータよりも文書への影響を追跡する方が重要ですが、データ系列はレコードの特定の列に明示的なソースと変換のリストを持つデータウェアハウスに関連していますたとえば、元のシステム(総勘定元帳)と計算(このアカウント+そのアカウント)について説明してください。 –