私はJavaDStreams
で動作するアプリケーションを持っています。 これはコードの一部です。ここでは、単語が表示される頻度を計算します。JavaDStreamをソートする - Spark Streaming
JavaPairDStream<String, Integer> wordCounts = words.mapToPair(
new PairFunction<String, String, Integer>() {
@Override
public Tuple2<String, Integer> call(String s) {
return new Tuple2<>(s, 1);
}
}).reduceByKey(new Function2<Integer, Integer, Integer>() {
@Override
public Integer call(Integer i1, Integer i2) {
return i1 + i2;
}
});
、私はトップN整数値によってソート頻繁要素を、印刷することを望んだ場合、(JavaPairRDD用)sortByKeyのようなメソッドが存在しない場合、私はこれをどのように行うことができますか?
自分でメソッドを実装することができます。 – Wang
はい、私は回避策を考えましたが、JavaDStreamを使用することはできませんが、RDDだけになります。 – sirdan
私はストリーミングのためにデータが絶えず来ていると思います。それを並べ替えるのは難しいです。 – Wang