PigでカスタムTextInputFormat区切り文字を設定する正しい構文は何ですか?私は以下のいくつかのバリエーションを試しましたが、キャリッジリターンラインフィードの代わりに文字列値として扱います。PIGでカスタム区切り文字を設定する方法
set textinputformat.record.delimiter '\r\n';
豚のバージョンは0.12.0-cdh5.9.0で、Hadoopのバージョンは2.6.0-cdh5.9.0
PigでカスタムTextInputFormat区切り文字を設定する正しい構文は何ですか?私は以下のいくつかのバリエーションを試しましたが、キャリッジリターンラインフィードの代わりに文字列値として扱います。PIGでカスタム区切り文字を設定する方法
set textinputformat.record.delimiter '\r\n';
豚のバージョンは0.12.0-cdh5.9.0で、Hadoopのバージョンは2.6.0-cdh5.9.0
理想的なないが、回避策です:
は、プロパティが含まれていmyprops.properties
のようにファイルを作成します次の行:次にtextinputformat.record.delimiter=\r\n
のようなスクリプトを実行します。それはこのようになりますpig -P ~/myprops.properties -f path/to/pigscript.pig
第四コメントの第四段落で述べたように、既知の問題である:ここではPIG_4572
は、これが私の作品構文
SET textinputformat.record.delimiter '<delimiter>';
がされ
それはお菓子をですので、これは制御文字では動作しません
値は文字列として返されます。 – Shawn
@shawnこれにはどんな解決策が見つかりましたか? –