0
hadoop hdfsに格納されているファイルの生の内容をバイト単位で読み取る方法はありますか?gzipを圧縮してhdfsに保存されているファイルの生の内容を取得するにはどうすればよいですか?
通常、-input
パラメータを持つストリーミングジョブを提出するときに、.gz
ファイル(-input hdfs://host:port/path/to/gzipped/file.gz
など)を指しています。
私のタスクは、1行ずつ解凍された入力を受け取りました。これはではなく、です。