2016-12-05 7 views
0

HDFSと負荷にgraphx頂点を保存は、私はRDDを作成し、後で

verticesRDD.take(3).foreach(println) 
(4000000031043205,1) 
(4000000031043206,2) 
(4000000031043207,3) 

私は経由してHDFSにこのRDDを保存します。

verticesRDD.saveAsObjectFile("location/vertices")

私はそれが働いていたことを確認するために、このファイルを試してみて、読んで:私は試してみて、検査時に

val verticesRDD_check = sc.textFile("location/vertices")

これはうまく動作します、しかし、何かが間違っています。

verticesRDD_check.take(2).foreach(println) 
    SEQ!org.apache.hadoop.io.NullWritable"org.apache.hadoop.io.BytesWritablea��:Y4o�e���v������ur[Lscala.Tuple2;.���O��xp 
srscala.Tuple2$mcJJ$spC�~��f��J _1$mcJ$spJ _2$mcJ$spxr 
                  scala.Tuple2�}��F!�L_1tLjava/lang/Object;L_2q~xppp5���sq~pp5���sq~pp5���sq~pp5���sq~pp5���esq~pp5���hsq~pp5��୑sq~pp5���sq~pp5���q sq~pp5��ஓ 

saveAsObjectFileを使用してRDDを保存する方法に問題がありますか?それとも、textFileで読んでいますか?

答えて

0

読み返したら、タイプを指定する必要があります。

val verticesRDD : RDD[(VertexId, Long)] = sc.objectFile("location/vertices") 
関連する問題