0
私はHIVE 13.1を広く使用しており、Impala 2.5で私の仕事の一部を実行したいと考えています。インパラでは現在のハイブのどの機能が利用できませんか?ワークフローをHiveからImpalaに移行した人はいますか?注目すべきことは何ですか?ハイブはimpalaにはない機能はありますか? Hive vs Impala
私はHIVE 13.1を広く使用しており、Impala 2.5で私の仕事の一部を実行したいと考えています。インパラでは現在のハイブのどの機能が利用できませんか?ワークフローをHiveからImpalaに移行した人はいますか?注目すべきことは何ですか?ハイブはimpalaにはない機能はありますか? Hive vs Impala
ここでの問題は、「機能の相違」自体ではなく、むしろユースケースに関係していると思います。
インパラは、1人のユーザーが長時間実行するETLジョブを実行する(したがってフォールトトレランスが主な要件です)場合、Hiveに比べていくつかの利点があります。
インパラは、分析を行うためのBIスタイルのクエリを同時に実行する複数のユーザーが必要とするため、インパラは常にハイブより高速です。
だから、両方に十分な余地があります。
DATEおよびDECIMALデータ型。いくつかのALTERコマンド*(ただし、これらはHiveシェルで実行できます)*。 Hiveは常にEXTERNALテーブルの新しいファイルをチェックしますが、Impalaはファイル内のファイルとブロックの場所を保持しているため、各クエリの前に強制的にキャッシュを更新する必要があります。 –
もちろん、ORC、AVROなどはサポートしていません。 –
INSERTコマンドで作成されたファイルの数は実際には制御できません。*(ハイブでは、リダクションの数を調整して "マージ"できます。 smallfiles "プロパティ)*。 –