union
を使用してSparkを使ってヌードリングを行い、適切に大きなテストデータセットを構築します。Sparkデータフレームへの変換を再帰的にscalaで適用できますか?
val df = spark.read.json("/opt/spark/examples/src/main/resources/people.json") df.union(df).union(df).count()
しかし、私はこのような何かをしたい:これはOKに動作エラーでbarfs val df = spark.read.json("/opt/spark/examples/src/main/resources/people.json") for (a <- 1 until 10){ df = df.union(df) }
<console>:27: error: reassignment to val df = df.union(df) ^
私はこのテクニックのpythonを使用して動作します知っているが、これは私はスカラ座を使用して私の最初の時間です構文が不明です。
再帰的にデータフレームを自分自身と結合する方法n回ですか?