2016-08-31 16 views
1

Kafka ConnectのHDFSコネクタを構成して、いくつかの別々のトピックを1つのファイルに書き込み/結合することは可能ですか?KafkaのトピックとHDFSの接続

トピックには同じavroスキーマのメッセージが含まれており、KafkaConnectをそれらのKafkaトピックとHDFSの間の仲介者として機能させたいと思います。最悪のシナリオでは、HDFSに書き込まれた後にトピックの内容が結合される可能性がありますが、HDFSコネクタではよりクリーンで迅速な方法が可能なように感じられます。

答えて

3

現在、HDFSコネクタは各トピックを独自のディレクトリに書き込みます。 HDFSに書き込む前にディレクトリを結合することも、HDFSに書き込む前にカフカのトピックを結合することもできますが、コネクタ自体はそれを行いません。

+0

「カフカのトピックを結合する前に」展開してください。 –

+0

2つのトピックのイベントを消費します(これはKafkaConsumerで可能です)。これはKafkaStreamsやMirrorMakerやハンドラでも簡単に聞こえます。 –

関連する問題