0
私は現在spark 2.0を使用しています。私は複数のパーティションを持つ寄木細工としてデータフレームを作成しようとしています。ScalaのpartitionBy defで複数のパラメータを渡すには?
下記のスパークシェルを実行しようとしています。
var partitionNames = "partition1,partition2"
var partition = partitionNames.split(",").map(elem => "\""+ elem + "\"").map(elem => elem.mkString) //"partition1","partition2"
df.write.partitionBy(partition).path("s3://")
上記の書き込みコマンドを実行すると、パーティション列がデータフレームに存在しないことを示すエラーが表示されます。
パーティションをハードコーディングすると機能しますが、引数として渡すときは機能しません。
あなたは再分割または融合を試みましたか? –