私はスパークするのが新です。私は2つのデータセットを含むコードに取り組んできました。そこで私は、マッパーの処理をしているPairFlatMapFunctionを使い始めました。Apache Spark:PairFlatMapFunctionで、Iterable <Tuple2 <Integer、String >>戻り値の型にタプルを追加する方法
JavaPairRDD<Integer, String> trainingArray = trainingData.flatMapToPair(new PairFlatMapFunction<String, Integer, String>(){
public Iterable<Tuple2<Integer, String>> call(String s) {
//code to form the tuples of type Tuple2<Integer, String>
// new Tuples2<Integer, String>
}
還元剤(reduceByKey)によって処理される反復可能クラスにタプルを戻す方法。
すべてのポインタは本当に感謝しています。