2017-04-27 8 views
1

Dataflow/Apache BeamにParDoFlatMapの違いがありますか?Apache BeamのParDoとFlatMap?

私は両方とも入力PCollectionの各要素に関数を適用し、iterableを返すと思います。私はいくつかの違いがなければならないと思いますか?

答えて

4

FlatMapは、より簡単な操作built as you might expect from ParDoです。これがあなたのニーズに合っているなら、それは良い選択です。

ParDoは、追加side inputsmultiple output collectionsaccess to the current windowのような機能、要素のバンドルを開始し、コミットするためのいくつかの本当に低レベルのコールバック、そしてより多くを持っている要素単位の計算の下位レベルのビルディングブロックです。

実際には、FlatMapParDoの多くの用途が同様のコード一括で終わっていますが、私の意見では、最も単純な(最高レベルの)変換を使用するのが最も読みやすいです。

+0

ありがとうございます。 FWIWのPythonの例では、サイド入力がある「FlatMap」が使用されています(https://beam.apache.org/documentation/programming-guide/)。あなたの提案として他人のための 'ParDo' – Maximilian

関連する問題