私は1ノードネームノードと3データノードを持つように構成された4ノードクラスタを持っています。 TPCHベンチマークを実行していて、クエリ応答時間に影響を与えずにクラスタが処理できるデータ量を知りたいと思っています。使用可能な全HDサイズは約700GBで、各ノードには8コアと16GBのRAMを搭載したCPUが搭載されています。私のHadoopクラスタはどのくらいのデータを扱うことができますか?
私はボリューム制限を見つけるために行うことができる計算を見ましたが、誰かが簡単にクラスタが処理できるデータ量を計算する方法を説明することができれば、ITを理解できませんでした。
は、あなたが処理のために使用され、ウルクラスタ内の中間結果を格納するために残り、データを格納するためにウルクラスター内のスペースの70〜80%を使用することができますあなたの