0
金曜日、私は超疲れていて、私は本当に奇妙な問題に対して立ち上がっていました。Hadoop:出力圧縮の制御文字
私のReducerでは、私はテキスト出力を持っています。これには、カスタム区切り文字を含む文字列が含まれ、次のMapReduceジョブで分割されます。
私は賢明だったと思いました。私が使用した区切り記号は、制御文字U + 0002でした。
出力時にファイルが圧縮されました。私は何かを分割する前に圧縮されていませんでした。私は非常に具体的には、私自身の理由で圧縮を避ける必要があります。私は手動で圧縮をオフにしようとしましたが、役に立たなかった。私は考えることができるすべてを試して約1時間か2時間、非常に不満でした。