2017-04-07 16 views
0

金曜日、私は超疲れていて、私は本当に奇妙な問題に対して立ち上がっていました。Hadoop:出力圧縮の制御文字

私のReducerでは、私はテキスト出力を持っています。これには、カスタム区切り文字を含む文字列が含まれ、次のMapReduceジョブで分割されます。

私は賢明だったと思いました。私が使用した区切り記号は、制御文字U + 0002でした。

出力時にファイルが圧縮されました。私は何かを分割する前に圧縮されていませんでした。私は非常に具体的には、私自身の理由で圧縮を避ける必要があります。私は手動で圧縮をオフにしようとしましたが、役に立たなかった。私は考えることができるすべてを試して約1時間か2時間、非常に不満でした。

答えて

0

答えは...出力に制御文字を使用しないでください。少なくとも、それは私が知る限りの答えです!他の誰かが同じ問題を抱えているのを聞いてみると、私は興味があります。