HDFSとGridFSは分散ファイル保存の2つの優れた技術ですが、その違いは何ですか?どのタイプの問題がそれぞれに適していますか?HDFSとGridFS:どちらを使うの?
7
A
答えて
0
GridFs他のFS対少し遅いです...最初にCEPHのような他のFSを考える...
分散ファイルシステム - ウィキペディア、フリー百科事典 - >http://en.wikipedia.org/wiki/Distributed_file_system
私はHDFSは本当にだと思いますFSしかしGridfS最終使用ベンチマークで唯一のデータベースグリッド
ですが、ほとんど示唆しない何か分散ファイルシステム
- のnginx-gridfs Benchma生の結果を追跡する| ypass.net - >http://www.ypass.net/solaris/nginx-gridfs-benchmarks/rawresults.php
2
Hadoopを使用している場合はHDFSを使用し、MongoDBを使用している場合はGridFSを使用してください。どちらもランダムなファイルを格納するだけではうまくいかない。これらは、分析プラットフォームで動作するように構築されています。
1
分析およびマップ削減ジョブなしでファイルを保存する場合は、GridFSを使用することをお勧めします。カスタマイズして維持するのが簡単です。私はファイルホスティングアプリケーションに使用しました。この場合のHFDSは過剰です。
3
バッチ処理(あなたがあなたのファイル一つ一つの多くを読みますクエリを実行するときに、知っている)が、実際に吸うためのものHDFSあなたがやってランダムアクセスそれを維持するために首に痛みや配備(あなたが知っている、これらの動物園のすべて、ネームノードなど)。一方、GridFSはバッチ処理の方が処理速度が遅くなりますが、ランダムアクセスが多い場合ではなく、HDFSに比べてストレージオーバーヘッドが大きくなります。
ウェブサイトをバックアップするために、analitycsとGridFSにHDFSを使用する必要があります。