データの機能であるtalendで何かをする方法を尋ねています。参加している間にtalendにデータを保持させないように指示する方法
私はジョイントまたはルックアップを実行しようとすると、talendはルックアップまたは参照データセットproir全体を結合に "暗記"しようとします。私のデータセットは、才能が「記憶」して仕事を殺すには大きすぎます。
データステージでは、結合ステージの前にソートステージを配置することでこれを回避できます。結合ステージでは、ソートされた結合を使用してこれを独占しますが、データセット全体はメモリに保持されませんが、参加している間に次のステージに参加して送られ、mmoryを節約します。
talendでこれをどのように達成できますか? ありがとうございます。
に行うことができます参加のため、この種のETLのパフォーマンスに影響を与える可能性のあるデータベースが180万件のレコードを取得していますあなたが180Milのレコードを持つテーブルを持っている場合、それはあなたがバッファに入れたものですか? – arcee123
180Milレコードのテーブルがある場合、Talendにデータを引き出すことはありません。あなたはそれの隣に "より小さい"データを置き、データベースに結合をさせます。 –