私はSparkの新機能です。 DataFrameをPOJOのRDDに変換したい。 Like:Spark DataFrameをJavaのPOJOのRDDに変換する方法
JavaRDD<POJOClass> data = df.toJavaRDD();
ここで、dfはDataFrameです。
df.show()
が与える次のように
+---------+---------+---------+---------+
| A | B | C | D |
+---------+---------+---------+---------+
|603300042| 1025| 2|127000948|
|603303766| 1112| 2|127000364|
|603302691| 1184| 2|127000853|
|603303766| 1112| 2|127000364|
|603302691| 1184| 2|127000853|
|603303766| 1112| 2|127000364|
|603303787| 1041| 2|137000323|
|603306351| 1041| 2|137000468|
|603304009| 1307| 2|137000788|
|603303830| 1041| 2|137000012|
|603301119| 1002| 2|137000369|
|603301507| 1188| 2|137001568|
|603302168| 1041| 2|137000468|
+---------+---------+---------+---------+
を私のPOJOクラスは次のとおりです。
public static class POJOClass {
public Long A;
public Integer B;
public Integer C;
public Long D;
}
私はうまく機能
JavaRDD<Row> data = df.toJavaRDD();
を知っています。しかし、私が達成しようとしているものに対する回避策はありますか?
こんにちは、RDDのみを使用する必要があります。 –