2016-12-23 14 views
0

私は現在、CSVデータをインポートし、アドレスフィールドを取得し、そのアドレスをジオコーディングのためにGoogle Maps APIに送信する小さなTalendジョブに取り組んでいます。その後、入力データとジオコーディングデータの両方を組み合わせる必要があります。Talend TRestClient:後で両方のフロー(行)のジオコーディングと組み合わせ

私の問題は、初期データ行とジオコーディング結果の組み合わせが不可能であると思われることです。 TRestClientを渡した後、入力データへの参照はすべて消えてしまったようです。

はここに私の非最終的なデータの流れです:

Subjob 1: CSVInput --> THashMapOutput 
    | 
    | 
Subjob 2: THashInput --> tRestClient --> tExtractJSONFields --> tMap --> tBufferOutput 
                    | (Lookup) 
                    | 
                   tHashInput 
    | 
    | 
Subjob 3: tBufferInput --> tFileOutputDelimited 

ここで、最後のTMAPは、入力行を参照する別名、外部キーを持っていません。したがって、ジョインは、入力とジオコードされた生のさまざまな組み合わせのクロス積を作成します。

入力とジオコーディングの両方の結果を組み合わせる方法はありますか?入力を転送するようにtRestClientを構成できますか?

(2つの結果のCSVファイルの組み合わせが同じ不足している識別子のために失敗するようだ)

答えて

1

[OK]を、答えは非常に簡単だった:

  1. は、あなたが行2と呼ばれるサブジョブ2の最初のリンクを持っていると仮定。
  2. 次に、2番目のtMapコンポーネントを開くことができます。
  3. 上記のルックアップを削除します。
  4. tMap内の行2への参照を追加します。 row2.URL、row2.Name

Et voila:各行にジオコーディングされた結果と元のデータが組み合わされています。

関連する問題