私は、Spark 2.0.0で 'preview' Google DataProc Image 1.1を使用しています。私の操作の1つを完了するために、私はデカルト製品を完成させなければならない。バージョン2.0.0以降、デカルト製品を禁止するspark構成パラメータ(spark.sql.cross Join.enabled)が作成され、例外がスローされています。できれば初期化アクションを使用してspark.sql.crossJoin.enabled = trueを設定するにはどうすればよいですか? spark.sql.crossJoin.enabled=true
spark.sql.crossJoin.enabled for Spark 2.x
答えて
Dataproc内の構成設定のデフォルト値を変更するために、あなたも、コマンドラインからクラスタを作成するときに--properties flagを使用することができ、初期化アクションは必要ありません。
gcloud dataproc clusters create --properties spark:spark.sql.crossJoin.enabled=true my-cluster ...
スパーク2.1+
あなたはcrossJoin
を使用することができます。
df1.crossJoin(df2)
それはあなたの意図が明示的になり、意図しないクロスが参加するからあなたを保護するための場所でより保守的な設定を保持します。あなたが明示的にデカルト積を許可したいとき
を呼び出すことができるはずですので
スパーク2.0
SQLプロパティはRuntimeConfig.set
方法で実行時に動的に設定することができます。
これは機能します!ありがとうございました! – Stijn
spark 2.1の前に 'crossJoin()'が 'DataFrame' /' Dataset'で利用できないようです。 –
@RickHaffey Spark 2.1以前のバージョンでは、 'spark.conf.set(" spark.sql.crossJoin.enabled "、true)'設定オプションで 'dataset.join(rightDataset)' APIを使用してください。このスタイルはSpark 2.1でも動作しますが、より明示的なので、.crossJoin APIが理想的です。 – Garren
のTPCDクエリセットベンチマークにはCROSS JOINS
を含むクエリがあり、CROSS JOIN
を明示的に記述するか、またはSparkのデフォルトプロパティをtrueに動的に設定しない限り、Spark.conf.set("spark.sql.crossJoin.enabled", true)
は例外エラーに遭遇します。
トランザクション処理委員会(TPC)の元のクエリ構文にコンマが含まれ、Sparkの既定の結合操作が内部結合であるため、TPCDSクエリ28,61,88、および90にエラーが表示されます。私のチームはまた、Sparkのデフォルトプロパティを変更する代わりにCROSS JOIN
を使用することに決めました。
- 1. Spark 2.x saveAsTable
- 2. Cloudera Hive on Spark 2.x?
- 3. MongoDB GridFSからSpark 2.x DataFrameをロード
- 4. spark 1.xからspark 2.xにsql_context.registerDataFrameAsTableを移行する方法
- 5. Spark 2.xバージョンでAzureキーを指定
- 6. Spark 1.xと2.xのさまざまなsparkcontextsの相違
- 7. Spark UDF for StructType/Row
- 8. Spark for Json Data
- 9. スパークジョブサーバfor spark 1.6.0
- 10. SPARK_WORKER_INSTANCES for Spark 2.2.0
- 11. Spark Implicit $ for DataFrame
- 12. 角度2 - ng For index <x
- 13. Spark T4 templates for ASP.NET MVC
- 14. forループのSpark列のデータ型検証 - Spark DataFrame
- 15. Apache Sparkとelasticsearch V5.X
- 16. ajax/ssl/X-Forwarded-For
- 17. XMLエディタfor OS X
- 18. Haskell Plugin for XCode 4 for OS X Lion
- 19. forループの最後に改行を削除する - python 2.x
- 20. Azureテンプレートfor Elastic 5.x
- 21. 256色モードxterm for MacOS X
- 22. OData 4.x Parser for .NET
- 23. Minimalist Python Server for Unity3d 5.x
- 24. Angar2プラグインfor SonarQube 6.x
- 25. Nginxロケーションブロックアクセスリストと 'X-Forwarded-For'
- 26. Kafka Consumer for Spark for Kafka API 0.10:カスタムAVROデシリアライザ
- 27. Java for Sparkのコンパイル方法は?
- 28. Python log(1 + x)/ x for x near 0を計算する
- 29. 各xについて...次へFor Each x ...次へx
- 30. Python 2 with Spark 2.0
これは機能します!ありがとう、デニス! – Stijn