2016-05-11 3 views
0

私は、重複をソースから除外してターゲットにロードするシナリオがあります。しかし、私は以下のいくつかの変換を使用して重複を除去する方法

1)SQLオーバーライド

2)検索

3)アグリゲータ

4)ランク

5)Unixコマンドを使用してはならない

6) Java

注:ソースには膨大な数のレコードがありますdsは

この点で

おかげで、よろしく

ラジ

+0

上記の変換を使用しない奇妙な要件。さて、 'Source qualifier'の中で' Distinct'を使ってみましたか? –

+0

これは奇妙な要求ですが、私はちょっとした研究をしています(仕事の一環として) 私はこれを達成するために、 。実際にはキャッシュを使用しないことを計画中です –

答えて

1

を助けてください、私は実際には要件がをキャッシュすることなく、重複を削除にあると仮定します。私は2つのソリューションを可能参照:「明確な」ソース修飾子プロパティを使用して、ソース・データベースへ

  • プッシュそれを、または
  • ソートSource QualifierプロパティNumber Of Sorted Ports(正しい順序でポートを置くことを忘れないでください)を使用してデータを、 Expression Transformationを作成します。ローカル変数を使用して、現在のキーと前のキーとを比較し、重複していない行のみを許可するFilter Transformationが続く削除を示す出力フラグを作成します。
+0

Maciejgありがとう –