私たちは現在、Cloud DataflowのコンセプトApache Beam Pipelineの実証に取り組んでいます。いくつかのファイル(テキストもカスタムバイナリ形式もあります)をGoogle Cloud Bucketに入れ、これらのファイルをbyte []として読み込み、フロー内でそれらを逆シリアル化したいとします。ただし、テキスト以外のファイルを読み取ることができるBeamソースは見つかりません。 唯一のアイデアは、FileBasedSource
クラスを拡張することですが、簡単な解決策があるはずです。なぜなら、この音はかなり簡単な作業のようなものだからです。Apache Beamでファイルをバイト[]として読み取るには?
ご協力いただきありがとうございます。