Azure Blobストレージ用Kafkaコネクタ

私はKafkaにプッシュされたメッセージを深いストレージに保存する必要があります。私たちはAzureクラウドサービスを使用していますので、Azure BLOBストレージがより良い選択肢になると思います。私はKafka ConnectのシンクコネクタAPIを使用してデータをAzure BLOBにプッシュしたいと考えています。 KafkaのドキュメントではHDFSにデータをエクスポートするよう提案していますが、その場合はHadoopを実行するLinux VMが必要です。私の質問は、Azure BLOBストレージがJSONオブジェクトを格納する適切な選択肢であり、カスタムのシンクコネクタを構築することは、このケースでは合理的な解決策ですか？Azure Blobストレージ用Kafkaコネクタ

出典

2016-08-10 Nara

カスタムシンクについては、それは ' s OK。現在、Azure BLOBストレージ用の公式シンクはありません。別の解決策が必要な場合は、Apache Flume（KafkaソースとAzure Sink）を試してみてください。参考までにこのリンクを参照してください：https://blogs.msdn.microsoft.com/bigdatasupport/2014/03/18/using-apache- flume-with-hdinsight / – NangSaigon

カスタムシンクコネクタは間違いなく動作します。 Kafka Connectはコネクターを差し込めるように設計されています。実際、コネクタの開発は完全に統合されています。 ConfluentのJDBCとHDFSコネクタは、2つのユースケースの人気のために最初に実装されましたが、さらに多くのものがあります（私たちが気づいているコネクタのリストを保持します）。

Azure BLOBストレージが適切なJSONオブジェクトについて言及しておきたいと思いますが、オブジェクトのサイズとAzureストレージのサイズがオブジェクトの数である&をうまく扱うかどうかだけ考えてください。他のオブジェクトストレージシステムでは、多数のオブジェクトを単一のBLOBに集約して多数のオブジェクトのパフォーマンスを向上させる必要があります（つまり、多くのJSONオブジェクトをサポートするファイル形式が必要な場合があります）。

出典

2016-08-11 17:46:31

Azure Blobストレージ用Kafkaコネクタ

答えて

関連する問題