2017-11-24 12 views
0
Employee 
Employee Type       : 0130 
Unit         : 4189670095711234 
Basic Salary       : 11.00 
Joined Date       : 04/12/yy 06:30:05 
Country        : 826-United Kingdom 

(123.66)      --- Endof Employee ------------- 

R 4567 ABCD    -> Len f---- i 01/14 

Employee 
Employee Type       : 0120 
Unit         : 4189670095711234 
Basic Salary       : 11.00 
Joined Date       : 04/12/yy 06:30:05 
Country        : 826-United Kingdom 

(123.66)-      --- Endof Employee ------------ 

R 4567 ABCD    -> Len f---- i 01/14 

Employee 
Employee Type       : 0130 
Unit         : 4189670095711235 
Basic Salary       : 11.00 
Joined Date       : 04/12/yy 06:30:05 
Country        : 826-United Kingdom 

(123.66)      --- Endof Employee ------------- 

こんにちは、私は才能を使用して構造化データに次の半構造化データを変換したいは、TalendのBigData

を使用して構造化データへの半構造化データを変換します。

データを構造化された形式に変換する方法と、リレーショナル表に挿入できるようにする方法を教えてください。

答えて

2


これはtPivotToColumnsDelimitedコンポーネントのおかげです。 enter image description here

tFileInputDelimiltedは、2つのフィールドスキーマ(名前付きプロパティと値)に関連付けられ、 ":"(スペース - コロンスペース)という特別なフィールドセパレータを持っています。
Avanced設定オプション "Trim all columns"と "Check each row structure to schema"がチェックされています。

TMAPは、「プロパティ」名応じて、各入力行のためのランクを関連付けるためにここにある:あなたが見ることができるように enter image description here を、シーケンス名はプロパティ名に基づいているため、同じ従業員の各ファイルレコードがあります同じランク値。

最後に、tPivotToColumnsDelimitedは、同じランク値を持つすべての入力レコードを1行で移動します。最も重要な値はrigthプロパティに関連付けられています。 enter image description here 「ピボット列」を「プロパティ」、「集計列」を「値」、「集計関数」を「最初」、「グループ化」を「ランク」と設定します。出力に必要なファイル名を選択し、最後に目的の結果が得られます。 enter image description here

希望します。

+0

うわー!出来た。どうもありがとう。 –

+1

素敵で独創的な答え。 –