-1
SparkSessionを使用してハイブデータベースに接続しています。私は、どのようなデータを豊かにするための最良の方法を決定しようとしています。私はスパークSQLを使用していたが、私はそれを使用するのに疲れている。大規模なクエリまたはデータフレームの変異?
SparkSqlはHive Sqlを呼び出しますか?つまり、Sparkの使用によるパフォーマンスの向上はありませんか?
スパークするために大きなSQLクエリを作成するか、それをデータフレームに変換してスパーク機能を使用して操作しないでください。
これはそれかそれです。スパークを使用してパフォーマンスを向上させることは、多くの問題、つまりデータの局所性、スパース性などに関係しています。ロードするには十分なRAMがあるかどうかにかかわらず、具体的な回答はできません。 @RickMoritzに言及されているように、よくテストする必要があります... – eliasah