私はDATAFRAME array<string>
などの取引があります。スパーク:RDDにdatarframeアレイ[文字列]を変更する方法[アレイ[文字列]]
transactions: org.apache.spark.sql.DataFrame = [collect_set(b): array<string>]
私はRDD[Array[string]]
にそれを変更したいが、私はそれを変更していたときにRDD
に、それがorg.apache.spark.rdd.RDD[org.apache.spark.sql.Row]
に変更ばかりだ:それはメッセージであるよう
val sam: RDD[Array[String]] = transactions.rdd
<console>:42: error: type mismatch;
found : org.apache.spark.rdd.RDD[org.apache.spark.sql.Row]
required: org.apache.spark.rdd.RDD[Array[String]]
val sam: RDD[Array[String]] = transactions.rdd
を?そして、 'Dataframeは実際には配列[行]'は偽です、DataFrameは単なる配列以上のものです –
はいデータフレームはそれ以上ですが、データフレームの基本単位は行です。 –
まだ、文字列の解析は間違っています。文字列の1つに "、"を付けるとどうなりますか?あなたのコード –