1
私はエレガントな方法でアプローチする方法がわからないという問題に直面しています。Spark/Scala - リストのRDDでkeyByを使用する[Int、Double]
First - RDD[(Int, Double)]
Second - RDD[MyObject, List[(Int, Double)])
私はこれらの2 RDDのキーとしてInt
を使用して参加する必要があります:私は、私が参加する必要があることを2 RDDのを持っています。最初のRDDでは、Int
を使用してkeyBy
を定義できますが、2番目のRDDでkeyBy
をどのように定義できますか?私の結果として得られたRDDは、以下の構造を持たなければなりません RDD[MyObject, Int, Double]
ここで、Double
は、Int key
で結合された後の2 Double
の乗算結果です。 2つのネストされたループでより洗練されたソリューションを探して解決できることを理解しています。