0
私は、重複をソースから除外してターゲットにロードするシナリオがあります。しかし、私は以下のいくつかの変換を使用して重複を除去する方法
1)SQLオーバーライド
2)検索
3)アグリゲータ
4)ランク
5)Unixコマンドを使用してはならない
6) Java
注:ソースには膨大な数のレコードがありますdsは
この点で
おかげで、よろしく
ラジ
私は、重複をソースから除外してターゲットにロードするシナリオがあります。しかし、私は以下のいくつかの変換を使用して重複を除去する方法
1)SQLオーバーライド
2)検索
3)アグリゲータ
4)ランク
5)Unixコマンドを使用してはならない
6) Java
注:ソースには膨大な数のレコードがありますdsは
この点で
おかげで、よろしく
ラジ
を助けてください、私は実際には要件がをキャッシュすることなく、重複を削除にあると仮定します。私は2つのソリューションを可能参照:「明確な」ソース修飾子プロパティを使用して、ソース・データベースへ
Source Qualifier
プロパティNumber Of Sorted Ports
(正しい順序でポートを置くことを忘れないでください)を使用してデータを、 Expression Transformation
を作成します。ローカル変数を使用して、現在のキーと前のキーとを比較し、重複していない行のみを許可するFilter Transformation
が続く削除を示す出力フラグを作成します。Maciejgありがとう –
上記の変換を使用しない奇妙な要件。さて、 'Source qualifier'の中で' Distinct'を使ってみましたか? –
これは奇妙な要求ですが、私はちょっとした研究をしています(仕事の一環として) 私はこれを達成するために、 。実際にはキャッシュを使用しないことを計画中です –