2017-01-20 4 views
0

データの機能であるtalendで何かをする方法を尋ねています。参加している間にtalendにデータを保持させないように指示する方法

私はジョイントまたはルックアップを実行しようとすると、talendはルックアップまたは参照データセットproir全体を結合に "暗記"しようとします。私のデータセットは、才能が「記憶」して仕事を殺すには大きすぎます。

データステージでは、結合ステージの前にソートステージを配置することでこれを回避できます。結合ステージでは、ソートされた結合を使用してこれを独占しますが、データセット全体はメモリに保持されませんが、参加している間に次のステージに参加して送られ、mmoryを節約します。

talendでこれをどのように達成できますか? ありがとうございます。

答えて

0

私はあなたが

  • ディスクに保存する「TMAP」の一時ファイル・ストレージ・オプションを使用することができると思います。
  • "tmap"でバッファサイズを拡大します。
  • それとも成分「tmemorize」

enter image description here

+0

に行うことができます参加のため、この種のETLのパフォーマンスに影響を与える可能性のあるデータベースが180万件のレコードを取得していますあなたが180Milのレコードを持つテーブルを持っている場合、それはあなたがバッファに入れたものですか? – arcee123

+1

180Milレコードのテーブルがある場合、Talendにデータを引き出すことはありません。あなたはそれの隣に "より小さい"データを置き、データベースに結合をさせます。 –

2

あなたはそれはあなたがまた、データベースサーバ

関連する問題