2016-07-09 22 views
1

Flink(DataStream docs)にDataStreamの外部結合がないことに驚きました。 DataSetについてはFlink:DataStreamに外部結合がありませんか?

あなたはすべてのオプションを持っている:離れて、通常のjoinDataSet docs)から、leftOuterJoinrightOuterJoinfullOuterJoinを。しかし、DataStreamの場合、単純な古い結合があります。

DataStreamのいくつかの基本的な特性のために、これは外部結合を行うことができませんか?それとも、近い将来にこれを期待できますか?

私が実際に取り組んでいる問題のためにDataStreamに外部結合を使用することができます...同様の動作を達成する方法はありますか?

答えて

0

DataStream.coGroup()変換を使用して外部結合を実装できます。 CoGroupFunctionは、特定のキーのすべての要素に対応する2つのイテレータ(各入力に1つ)を受け取り、一致する要素が見つからない場合は空になることがあります。これにより、外部結合機能を実装できます。

Flinkの次のリリースのいずれかでDataStream APIに外部ジョインのファーストクラスのサポートが追加される可能性があります。私はそのような努力を現時点では認識していません。ただし、Apache Flink JIRAで問題を作成すると効果があります。

+0

申し訳ありませんが、問題が発生した場合は、[jira](https://issues.apache.org/jira/browse/FLINK-4188)です。私は 'coGroup'を試してみます:) – houcros

関連する問題