2016-12-12 6 views
1

私はスパークするのが新です。私は2つのデータセットを含むコードに取り組んできました。そこで私は、マッパーの処理をしているPairFlatMapFunctionを使い始めました。Apache Spark:PairFlatMapFunctionで、Iterable <Tuple2 <Integer、String >>戻り値の型にタプルを追加する方法

JavaPairRDD<Integer, String> trainingArray = trainingData.flatMapToPair(new PairFlatMapFunction<String, Integer, String>(){ 
     public Iterable<Tuple2<Integer, String>> call(String s) { 
//code to form the tuples of type Tuple2<Integer, String> 
// new Tuples2<Integer, String> 
} 

還元剤(reduceByKey)によって処理される反復可能クラスにタプルを戻す方法。

すべてのポインタは本当に感謝しています。

答えて

1

ありがとうございます!

私はこの質問の答えを見つけました。

私たちは、ArrayListの

List<Tuple2<Integer, String>> result = new ArrayList<Tuple2<Integer, String>>(); 

以下

result.add(new Tuple2<Integer, String>(keyValue, concat)); 

以下のようにタプルを追加し、結果を返す定義する必要があります。

0

結果が1つのタプルのみで構成されている場合は、これがより良い方法です。

return Collections.singletonList(new Tuple2<Integer, String>(keyValue, concat)).iterator(); 
関連する問題