2016-06-30 15 views
1

はどのように変換するには、このRDD [(ロング、反復処理可能[文字列])]へ...スパーク:RDD [(Long、Iterable [String])]をRDD [(Long、String)]に変換する方法はありますか?

(852403,Set(PT0000094043, PT0000097083, PT0000036162)) 
(357331,Set(PT0000068829, PT0000094042, PT0000066859)) 

RDDこのような[(ロング、文字列)]?

(852403, PT0000094043) 
(852403, PT0000097083) 
(852403, PT0000036162) 
(357331, PT0000068829) 
(357331, PT0000094042) 
(357331, PT0000066859) 

答えて

2

flatMapValuesをお試しください:

rdd.flatMapValues(identity) 

flatMap

rdd.flatMap{ case (k, vs) => vs.map(v => (k, v)) } 
関連する問題