0
私は実行エンジンとしてスパークでハイブに取り組んでいます。テーブルは、非圧縮の寄木細工です。数秒でハイブ "挿入する...選択...限界"非常に遅い
このステートメントのデータを返します:
select * from mydb.src_table
limit 100;
しかし、私は次の操作を行い、insert
文は非常に遅いです:
create table mydb.dest_table
like mydb.src_table
;
insert into mydb.dest_table
select * from mydb.src_table
limit 100
;
私は10分後にinsert
クエリを殺しました。 src_table
はかなり大きく(2億以上の行、多くのテキストを含む数個の列)、100行しか得られません。私はちょうどselect ... limit
が非常に速いが、insert ... select ... limit
がとても遅い方法を理解していない。
select
のEXPLAIN
は1段階を示します。しかし、insert
の場合、それは8段階以上を示しています - 何が起こっているのですか?
アイデア?
おかげで、私はそのイディオムの承知しているが、私はデータを挿入することはそうである理由を知りたい、これを試してCTAS
を試してみてください選択を100行に制限しているときは遅いです。 –
ハイブコンソールまたは他のプラットフォームでクエリを実行していますか? –
色相ウェブインターフェイスの使用。 –