2017-10-17 8 views
0

いくつかのクエリを実行するために私のクラスタにprestoをインストールしました。私は16GBのRAMを持つ4つのノードを持っています。私はprestoを設定するステップに従ってきましたが、クエリを実行するとHiveの同じクエリよりもずっと多くの時間がかかります。だから私は私の構成に何かが間違っていると思う。Prestoを構成するには

おそらく私のnode.propertiesファイルの値が のquery.max-memoryとquery.max-memory-per-nodeの間違った値だと思います。各ノードに16GBのRAMがあることを考慮に入れて、このプロパティの正しい値は何ですか?

ありがとうございました

答えて

0

あなたが修正する必要があるかもしれない正しいプロパティが見つかりました。しかし、 "正しい"値はありません...それは実際にあなたのデータ+クエリに依存します。実行しているデータセットとクエリの種類の概要を教えてください。

+0

ここで私はいくつかのTPC-DSベンチマーキングを実行したかった –

+0

あなたはどのようなスケールファクターを使用していますか?期待どおりに動作しないサンプルクエリがいくつかありますか?それともそれらのすべてですか? –

+0

私はベンチマークを実行するために10,30,50,100GBmを使用しています...私が持っている最も重要なケースはクエリ95です。これは10GBのスケールファクタ(https:// github .com/hortonworks/hive-testbench/blob/hive14/sample-queries-tpcds/query95.sql)他のユーザーは、クエリの実行中にすべてのワーカーを強制終了します –

関連する問題