に、任意のN列を変換する - そのような何か:スパークスカラ:私は残りの列にその映画のためのさまざまなユーザーのための映画のID(最初のカラム)および評価を表す次のようなデータ構造を持っている地図
+-------+----+----+----+----+----+----+----+----+----+----+----+----+----+----+----+
|movieId| 1| 2| 3| 4| 5| 6| 7| 8| 9| 10| 11| 12| 13| 14| 15|
+-------+----+----+----+----+----+----+----+----+----+----+----+----+----+----+----+
| 1580|null|null| 3.5| 5.0|null|null|null|null|null|null|null|null|null|null|null|
| 3175|null|null|null|null|null|null|null|null|null|null|null|null|null| 5.0|null|
| 3794|null|null|null|null|null|null|null|null|null|null|null| 3.0|null|null|null|
| 2659|null|null|null| 3.0|null|null|null|null|null|null|null|null|null|null|null|
を
私はそれが
のようなものになるようにfinal case class MovieRatings(movie_id: Long, ratings: Map[Long, Double])
のDataSetにこのデータフレームを変換したいです3210
[1580, [1 -> null, 2 -> null, 3 -> 3.5, 4 -> 5.0, 5 -> null, 6 -> null, 7 -> null,...]]
等
これを行うことができますか?
ここのことは、ユーザー数は任意であるということです。そして、それらを単一の列に圧縮して、最初の列は元のままにします。
の可能性のある複製を[2.0スパーク - DataSetにデータフレームを変換](https://stackoverflow.com/questions/40700213/spark-2 -0-convert-dataframe-to-dataset) – Pavel
私はこれが重複しているとは思わないこの質問はどのように私はそれを行うのですか、そしてその質問は私がこれをしようとしていて、 Sparkをアップグレードする必要があります。この質問はチュートリアルを求めているので、話題にはなりません。 – jmarkmurphy