2017-01-31 13 views
0

私はspark 2.1とScalaのいくつかの旅行で人の距離を計算しようとしています。Spark Scala - reducebykey =>値の配列の2番目の要素を取得する方法?

私は鍵が人物であることをpairedRDDを持っており、リスト、旅のリスト:私はキロの数を追加したいと思い

enter image description here

:(性別、キロのNB)キーによって、私は第2の値(kmのnb)にアクセスする必要がありますが、私はどのように見つけません。 私が試した: enter image description here

とさらに簡単に:enter image description here

私はスカラ座に新しいです、とのpythonから来る私はtはそれを得る "ドン: -/

編集1

提案しよう解決策: enter image description here

編集2

私はそれを得ることはありません4

enter image description here

編集:私は私の変数名を配合していますように編集3

とjoinedrddのサンプル210

enter image description here

は(私は少しを感じています: aとbはシステムに対して透過的に見える: 次の3つの指示は同じ結果を与える: enter image description here

編集5

enter image description here

+0

私はいくつかのjoined_rddデータ-joinedrddは 'trajets_par_cycliste' の別名であることを示すために、質問を編集し –

+0

ペア '(sex、nb of km)'は 'rdd'のレベル3にネストしています。 – mrsrinivas

+0

...どのようにそれをフェッチするのですか? –

答えて

0

私は最終的に方法を見つけた:

trajets_par_cycliste.map(x => (x._1 , x._2.map({case (k,v) => v.toDouble}).sum)).take(3) 

enter image description here

関連する問題