6
RDD
を寄木張りファイルとして保存します。これを行うには、私はDataFrame
にRDDを渡した後、私は寄木細工のファイルとしてDataFrame
を保存するための構造を使用します。RDDをDataFrameに渡すためのStructType作成の自動化方法
val aStruct = new StructType(Array(StructField("id",StringType,nullable = true),
StructField("role",StringType,nullable = true)))
val newDF = sqlContext.createDataFrame(filtered, aStruct)
質問は、それらのすべてがStringType
であると仮定し、すべての列に対して自動的にaStruct
を作成する方法ですか?また、nullable = true
の意味は?すべての空の値がNull
に置き換えられることを意味しますか?
機能のリストが長い場合はどうなりますか?私は( "id"、 "role")の使用を避けたい。各RDDが同じ構造RDD [Map [String、Any]]であると仮定して、フィーチャのリストを作成することは可能ですか?ここでStringはフィーチャですか? – duckertito
機能のリストが長い場合、 'toDF'にパラメータを渡さないでください(sparkに' _1'、 '_2'などのカラム名を使用させる)か、' colNames'リストを使用してそれを解凍することができます'myRDD.toDF(colNames:_ *)' –
@duckertito最新の編集を参照してください –