2017-12-06 8 views
1

私はkafkaメッセージを読み込み、AWS s3のORCファイルにメッセージをダンプするFlinkストリーミングプログラムに取り組んでいます。私は、FlinkのBucketingSinkとORCファイルライターの統合に関する文書はないことを発見しました。このようなORCファイルライタの実装はBucketingSinkで使用できません。Apache FlinkでBucketingSinkを使ってORCファイルに書き込む方法は?

ここには何か考えがありますか?

答えて

1

私は同意すると、BucketingSink ORCファイルのライターは素晴らしい機能になります。しかし、まだFlinkには貢献していません。あなたはそのような作家を自分で実装しなければなりません。

Flinkに寄稿することを考えているなら、Flinkコミュニティが作家のデザインとレビューに役立つと確信しています。

+0

Fabianに感謝します。私は 'StreamWriterBase'をチェックしています。このクラスを拡張したいと思います。 [ORCライター](https://github.com/apache/orc/blob/master/java/core/src/java/org/apache/orc/Writer.java)はストリームを受け入れません。だから私は 'Writer'インターフェースを実装しなければなりません。それ以上のアイデアはありますか? – Freedom

+0

私はそれについて詳しくは見ていませんが、 'StreamWriterBase'インターフェースの代わりに' Writer'インターフェースを実装することが可能でなければなりません。作者はORCの[core-java Writer](https://orc.apache.org/docs/core-java.html)をラップします。 –

関連する問題