私はパイプラインに過去30日間のローリングウィンドウを読み込みたいと思います。 2017年1月15日に、私が読みたい:TextIO.GCフォルダをパイプラインに読み込み、過去30日間の名前を日付とします。
> gs://bucket/20170115/*
> gs://bucket/20170114/*
>.
>.
>.
> gs://bucket/20161216/*
Thisは、( "?"、 "*"、 "[..]")と言うglobパターンは私が
Similar question, but with no good example
をサポートしています30のText.IO.Readステップを実行しないようにしようとすると、すべてのPcollectionを1つにまとめると、パイプラインにホット・シャードが発生します。