私はほぼ同じ数のレコードを持つハイブで2つのテーブルに参加しようとしています。クエリの実行に時間がかかります。 なぜハイブでJOINSを実行するのに時間がかかりますか? レコード数は両方のテーブルで約50kです。なぜHIVE結合では実行にかなりの時間がかかりますか?
答えて
ハイブクエリは内部的にマップリダクションに変換され、実行には数分かかるので実行されます。パフォーマンスを向上させるさまざまな方法があります。クエリのパフォーマンスを向上させるには、linkに従ってください。
ハイブまたはHadoopを使用する主な理由は、大量のデータを処理するためです。したがって、巨大なデータを扱う際に、他のリレーショナルデータベースと比べてはるかに大きなパフォーマンスが得られます。しかし、おそらくあなたが言及しているデータの量は、ハイブの良いユースケースではありません。
map reduceは少数のレコードではなく、私が行っているジョインは巨大なデータセットのサブセットです。このデータは、巨大なデータセットからのフィルタリングされたデータです。しかし、私は1つのセットを得るために2つのテーブルに加わる必要があります。 – v83rahul
ハイブでのデータの結合は絶対にうまくいきます。コメントでここで言及していることから、私はあなたのレコードをフィルタリングするフィルタリング基準を持っていると推測しています。したがって、テーブルを作成する際に参加する列に基づいてパーティションとバケットを使用することができ、パフォーマンスがさらに向上します。 –
- 1. なぜpopToRootViewContollerがフリーズしたり、実行に時間がかかりますか?
- 2. なぜこのMATLABスクリプトは実行に時間がかかりますか?
- 3. SQL結合のどのテーブルが実行に時間がかかりますか?
- 4. なぜurllib2は読みに時間がかかりますか?
- 5. なぜSQLで結果を返すのに時間がかかります
- 6. なぜSSRSは設計時に実行するには時間がかかりますか?
- 7. なぜUIAlertViewのインスタンス化に時間がかかりますか?
- 8. なぜこのEFクエリに時間がかかりますか?
- 9. なぜ私のプログラムに時間がかかりますか?
- 10. なぜこのクエリに時間がかかりますか?
- 11. なぜinfomation_schemaのクエリに時間がかかりますか?
- 12. このストアドプロシージャは実行に時間がかかりますか?
- 13. LINQPadは実行に時間がかかりますか?
- 14. 次のコードの並列化が実行に時間がかかりすぎるのはなぜですか?
- 15. IPhone IOS:PHPスクリプトの実行に時間がかかりますか?
- 16. Postgresの計画は実行に無駄な時間がかかります
- 17. なぜプログラムの実行時間は測定値ではありませんか?
- 18. なぜ私のプログラムは時間がかかりません
- 19. Capybara rspecテストには時間がかかります - なぜですか?
- 20. コードは.NETの別スレッドで実行するのにかなり時間がかかります
- 21. なぜPython ThreadPoolExecutor.mapは、ProcessPpplExecutorと比較して、結果が出るまでに時間がかかりますか?
- 22. 複数の結合を実行しているMySQLクエリが実行に時間がかかりすぎる
- 23. ドッカーのビルドに時間がかかりすぎるのはなぜですか?
- 24. コード実行時にC++がC++より高速なのはなぜですか?
- 25. なぜ私のajax呼び出しには時間がかかりますか?
- 26. なぜPythonのthis forループには時間がかかりますか?
- 27. なぜカフカの消費者は、消費に時間がかかりますか?
- 28. 私の宝石はなぜロードに時間がかかりますか?
- 29. MONGODB単純なクエリが実行に時間がかかりすぎるのはなぜですか?私のクエリは多くの時間を要し
- 30. 私のUUIDが時間がかかりすぎるのはなぜですか?
なぜこの質問が下されたのですか?質問を改善する方法についての有益なコメントを追加してください。私の5セント:詳細を追加してください:クエリー、実行時間、クエリープラン – leftjoin