テーブルのヘッダー行の上にテキスト行(および空白行)がある場合、Excelファイルがいくつかあります。Talendを使ってDIを開いて、一番最初の行から抽出値を抽出してから、列を処理します。
ファイルを処理してその行からテキストを抽出し、複数のファイルを追加するときに列として含めることができるようにするにはどうすればよいでしょうか?各ファイルを2回処理する必要はありませんか?
例
This file was created on machine A on 01/02/2013
Task|Quantity|ErrorRate
0102|4550|6 per minute
0103|4004|5 per minute
、複数の類似したファイルからデータ
Task|Quantity|ErrorRate|Machine|Date
0102|4550|6 per minute|machine A|01/02/2013
0103|4004|5 per minute|machine A|01/02/2013
0467|1264|2 per minute|machine D|02/02/2013
エレガントなソリューション、同じファイルからの2つの入力を使用してのアイデアが頭に入ったことはありません。何か問題がありますか?1)入力の1つをブロックしているファイルロックについて2)ルックアップに時間内に処理されたヘッダーデータを持っていないtMapで2) – mobcdi
ファイルに書き込んでいない限り私はあなたがファイルロックに関しては問題ないと信じています。私のサンプルは正常に動作しましたが、少数の行しか持たなかったので、本番環境で使用する行数に基づいてボリュームテストを試してみることをお勧めします。このアプローチの大きな欠点は、動的ではないことです。毎回一定数のファイルが入ってくるのですか? –
また、私は過去にマシン名(あなたの場合)と日付のようなメタデータをファイル名に埋め込んでいます。それから、そこから取得することができ、2つの入力でファイルを読むことを心配する必要はありません。 –