1
HDFSに何百万もの小さなファイル(バイナリファイル、イメージ、exeなど)(〜1Mb)を保存したいのですが、私の要件は基本的にはランダムファイルをクエリでき、MapReduceジョブは実行できません。 私の主な問題は、MapReduceマッパーではなく、ネームノードのメモリの問題です。HDFSの小さなファイルデザイン
だから私のオプションは以下のとおりです。
- HARファイル - 集約小さなファイルのみそのHARでそれらを保存するより:別の場所にある//パス
- シーケンスファイル - 彼らが来るようにそれらを追加し、この私はアスクン思うよHBaseのに小さなファイルを保存すると、Googleの
にいくつかの記事に記載されている別の解決策である - 私はかなり解消ので、それは
おかげで、