RDD

2016-09-27 8 views
0

へ/からフィールドを選択/追加私はRDDはtimestampurl、...などの分野でdataRddを言うことができますしました私はこのdataRddからいくつかのフィールドで新しいRDDを作成したいRDD

。コードセグメント続い

timestampURLは値ではなく、フィールド/列の名前と考えられる新しいRDDを、作成:

var fewfieldsRDD= dataRdd.map(r=> ("timestamp" -> r.timestamp , "URL" -> r.url)) 

しかし、コードセグメント、onetwothreearrival、及びSFO以下で列名として考えられている。:

val numbers = Map("one" -> 1, "two" -> 2, "three" -> 3) 
val airports = Map("arrival" -> "Otopeni", "SFO" -> "San Fran") 
val numairRdd= sc.makeRDD(Seq(numbers, airports)) 

誰も私が間違って何をやって教えてもらえますし、どのように私はレコード生成することができますe別のRddの値にマッピングされたフィールド名を持つ新しいRdd?

答えて

0

Mapではなく、タプルのRDDを作成しています。試してください:

var fewfieldsRDD= dataRdd.map(r=> Map("timestamp" -> r.timestamp , "URL" -> r.url)) 
+0

ありがとうございました。 – user3776105