私はETLプロセスのための合理的なテストを作成しようとしています。ETLテストデータセット/フレームワーク
リファレンス/テストの取り込みデータセットが必要と考えています。私はクライアントデータを使用したくありません(これはもう一つの選択肢です)。
このテストデータセットで現在のETLを実行して、参照変換を取得します。そうすれば、ソースコードが変更されたときに、ETLで現在作成されているものへの参照をテストし、回帰が作成されていないことを確認できます。
私はこれが正しいアプローチであるとは確信していません。たとえば、ソースコード内で変換が変更された場合、参照変換と比較したテストは正しく失敗します。その変換のための新しい参照変換データセットを作成する必要があります。開発者のチームが別々の変換に変更を加えると、これは狂っています。
最終的には、テストデータセットを作成して変換をテストする方法が必要です。何か案は?
私はテストデータセットを作成し、現在のETL最終結果と比較するのではなく、ETLが従うべきロジックに従って最終結果を検証する一連のテストを作成します。テストは、特定の結果を探しているSQLクエリのようなものであり、自動化することができます。このようなテストには多くのコミットメントが必要であり、余分な時間がかかります。テストデータシナリオとテスト自体が必要です。しかし、あなたのETLが何をすべきかを確認するのに役立ちます。 – Rich