0
spark-submitコマンドの最適なメモリ設定の計算方法は?spark-submitコマンドのメモリパラメータ
私は、SparkのOracleから4.5GBのデータを持ち込み、Hiveテーブルと結合してOracleに書き戻すような変換を行っています。私の質問は、spark-submitコマンドをどのように最適なメモリパラメータで呼び出すかです。
spark-submit --master yarn-cluster --driver-cores 2 \
--driver-memory 2G --num-executors 10 \
--executor-cores 5 --executor-memory 2G \
--class com.spark.sql.jdbc.SparkDFtoOracle2 \
Spark-hive-sql-Dataframe-0.0.1-SNAPSHOT-jar-with-dependencies.jar
どのようにドライバメモリであるべきか、必要なドライバ/エグゼキュータメモリの量、必要なコアの数などは?