1
10000を超える異なる値を持つ列をピボットしようとしています。個別値の最大数のSparkのデフォルトの制限は10000であり、私はこのエラーをpysparkのpivotMaxValuesを設定するには?
を受信していピボット列
COLUMN_NUM_2
以上10000の異なる値を有し、これはエラーを示すことができます。これが意図されていた場合は、spark.sql.pivotMaxValuesを少なくともピボットカラムの別個の値の数に設定してください。
これをPySparkでどのように設定しますか?
私はSparkクラスタを起動する前に問題を解決しました。 KEYはspark.sql.pivotMaxValuesであり、VALUEを100000に設定しています – technOslerphile