どのような分散ファイルシステムでも、小さなファイルに対する操作を考慮するとき、最も重要な点の1つはネットワーク遅延です。分散ファイルシステムコンポーネント間でできるだけ小さく(0.1msなど)する必要があります。これを実現する最善の方法は、信頼できるスイッチを使用して、すべてのマシンを同じスイッチに接続することです。
はまた、(特にMooseFS中)、分散ファイルシステムに最善のことは、スケーラビリティである - それは意味し、より多くのあなたが持っているノード(とは、より多くのあなたの計算がはすなわち、分散している複数のマウント上で同時に行われる)ことを、クラスタが高速になります。
MooseFSを使用している場合、3.0より小さなファイルの操作が改善されているので、MooseFS 3.0をチェックしてください。これは簡単な方法です。なぜなら、アップグレードの前にマスターサーバー上の/ var/lib/mfs(メタデータ)をバックアップすることを覚えておく必要があるからです。 MooseFSは小さなファイルをうまく扱うことができるので、設定に問題がありますか?
さらに、(小さなファイル操作を考えているにもかかわらず)最も重要なことの1つは、CPUコアが少量で、マスターサーバーのBIOSで省エネオプションが無効なCPUクロック(たとえば3.7 GHzなど) Master Serverはシングルスレッドプロセスなので)。 ChunkserversとClientsでは、状況は異なります。それらはマルチスレッドであるため、マルチコアCPUを使用している間はより良い結果が得られます。
さらに、「仮想マシンとMooseFS」段落4にMooseFS Best practicesに述べたように:
[...]我々は、仮想マシン上でMooseFSコンポーネント(特にマスターサーバー(複数可))実行することはお勧めしません。 。
VM上でMFSを実行すると、結果が悪くなる可能性があります。