2016-08-15 19 views

答えて

8

データ出所は、すべてのデータの起源と帰属を理解することについてです。典型的なシステムでは、「ログ」を取得します。一連のプロセスやキューを流れるデータを考慮すると、多くのコースが終了します。与えられたデータが取ったパス、またはそのパスを取るのにかかる時間、または異なるオブジェクトに分割されたオブジェクトに何が起こったかなど、すべてが本当に時間がかかり厳しくなります。 NiFiがサポートしている根源は、ステロイドに頼るようなものであり、データとそれが起こった事象に影響を与えた出来事との関係を維持し追跡することです。 NiFiは、各データがどこから来ているのか、データについて学んだのか、分割、結合、変換、送信場所、最終的にデータを破棄するのかを追跡します。それはデータの保管の鎖のように考えることができます。

これはいくつかの理由で本当に価値があります。まず、理解とデバッグ。この起源を把握することは、たとえデータがどこから来てどこに来たのかを見るために、流れの中で前進したり後退したりすることができます。また、NiFiにはバージョン管理されていないコンテンツストアがあり、フローの各段階でコンテンツに直接クリックすることもできます。最新のフローに対して、特定のイベントのコンテンツとコンテキストを再生することもできます。これは、構成と結果の大幅な高速化を意味します。この起源モデルは、コンプライアンス上の理由からも価値があります。正しいシステムにデータを送信したかどうかを証明できます。あなたがそれをしていないことを知ったら、問題に対処できるデータがあるか、フォローアップのための強力な監査証跡を作成します。

Apache NiFiの起源モデルは本当に強力で、Apache NiFiのサブプロジェクトであるApache MiNiFiにも拡張されています。より多くの起源を生み出すシステムが増えると、エンドツーエンドでデータを追跡する能力がはるかに強化されます。もちろん、他の系統系統や集中系統系統と組み合わせることができれば、さらに強力になります。 Apache Atlasはこれを統合して一元的なビューを得るための素晴らしいシステムです。 NiFiは私が上記のことを行うだけでなく、これらの出来事をそのような中央店に送ることもできます。それでは、これを楽しみにしています。

希望に役立ちます。

+0

これは非常に役に立ちます/ –

関連する問題