私はTestDFSIOを使用して、hadoop I/Oパフォーマンスのベンチマークを行っています。 私が使用しているテストリグは、3つのデータノードと1つの名前ノードの小さな仮想クラスタです。 各VMには、6〜8 GBのRAMと100〜250 GBのHDDがあります。私のセットに関してパラメータ(ファイルサイズ)各ファイルのファイル数の値(nrFIles)と、ファイルサイズがどうあるべきかハイドープベンチマークのベストプラクティスは何ですか?
アップなど、我々その:私は約2物事を知りたい
私の小規模なクラスタの結果を、8-12 x 2 TBのハードディスクと64 GBのRAMと高い処理速度のような標準サイズのクラスタに関連付けることができます。そうするのも正しいですか?
一般的に、ベンチマークハープのベストプラクティスは何ですか?同様に: 推奨クラスタ仕様(datanodesのスペック、namenodesは)何で、テストデータのサイズを推奨、テストベッドは、実生活のHadoopアプリケーション
私は結果が本番クラスタに関連しているように、正しいhadoopテストリグのセットアップと正しいテスト方法について知りたいだけです。
実証済みの作業については参考になると便利です。
は私がマップタスクの数がnrFiles のために言及した数に等しくなります見つけ-nrFiles 15 -fileSize 1ギガバイト を持っていますが、どのように、彼らは3つのデータノードに分散しているとしているもう一つの問題?マップタスクの15の数は私には分かりません。それは15のファイルのように各ファイルは、1つのマッパーがそれに取り組んでいますか?
testDFSIOがどのくらい正確に動作しているかのドキュメントや説明は見つかりませんでした。
ようこそ、あなたに何を試したのですか、何を期待していますか? ://stackoverflow.com/help/how-to-ask) – Nehal
私は今私の質問をより明確にしたいと思う。 – samiran