0
hereのように、MongoからSparkへのダンプをbson
にロードしています。それは動作しますが、私が取得することである:BSONObjectからDataFrameへのRDD
org.apache.spark.rdd.RDD[(Object, org.bson.BSONObject)]
それは基本的にすべてのString
フィールドでちょうどJSONでなければなりません。残りのコードでは、データを操作するためにDataFrameオブジェクトが必要です。しかし、もちろん、toDF
はそのRDDで失敗します。すべてのフィールドをString
としてSpark DataFrameに変換するにはどうすればよいですか? spark.read.json
と似たようなものがあれば素晴らしいでしょう。