Verticaテーブルの列数はクエリのパフォーマンスに影響しますか？

500個の列と100,000個の行を含むVertica 8.1テーブルを使用しています。Verticaテーブルの列数はクエリのパフォーマンスに影響しますか？

次のクエリは、（任意のネットワーク遅延の問題を解消するために）まっすぐにVerticaクラスタノードのいずれかにVSQLクライアントを使用する場合でも、実行するのに約1.5秒かかります。

SELECT COUNT(*) FROM MY_TABLE WHERE COL_132 IS NOT NULL and COL_26 = 'anotherValue'

しかしチェックquery_requestsテーブル、request_duration_msはわずか98ミリ秒であり、resource_acquisitionsテーブルはリソース取得における遅延を示さない。私は残りの時間がどこで使われたのか理解できません。

次に、クエリで使用されている列のみを新しいテーブルにエクスポートして、この新しい小さいテーブルでクエリを実行すると、query_requestsテーブルで依然としてrequest_duration_msがわかります約98ms。

したがって、これらの列のほとんどが参照されていなくても、表の列の数は問合せの実行時間に影響するようです。私が間違っている？もしそうなら、どうしてそうですか？事前

出典

2017-12-04 Nicolas Riousset

500カラムテーブルのソート方法は？そして2列のバージョンはどうですか？あなたは説明の計画を共有していただけますか？ – mauro

によって

おかげで、あなたのクエリがすべてのテーブルが含まれます（デフォルト）superprojectionに対して実行されているように聞こえます。 Verticaは（圧縮とエンコーディングが関連付けられた）列データベースであるにもかかわらず、クエリはおそらくまだ必要以上に多くのデータに触れているでしょう。

クエリを最適化するためにprojectionsを作成することができます。投影には列のサブセットが含まれます。クエリが必要とするすべての列を持つクエリが使用可能な場合、クエリはスーパープロジェクションの代わりにそのクエリを使用します。（物理的な位置も要因ですので、それはa little more complicatedです。）Database Designerを使用すると、スキーマとサンプルクエリに基づいて初期投影を作成し、時間の経過と共に反復的に改善することができます。

出典

2017-12-04 22:54:46

お返事ありがとうございました。私はテーブル構造が自動的に生成され、更新され、移入され、それに対して実行されるクエリを制御することができないので、このようにしたくないのですが、私は投影マニュアル作成を掘り下げなければならないと思います。 –

私はVertica 8.1.0-1を実行していましたが、パフォーマンスの低下を引き起こすVertica計画段階でVerticaのバグが問題だったようです。オプティマイザ - - この修正クエリ計画段階複雑なクエリのパフォーマンスを向上させ [https://my.vertica.com/docs/ReleaseNotes/8.1.x/Vertica_8.1.x_Release_Notes.htm]

VER-53602：それは> = 8.1.1のバージョンで解決しました。

出典

2018-02-09 16:31:14

Verticaテーブルの列数はクエリのパフォーマンスに影響しますか？

答えて

関連する問題