2016-08-10 14 views
0

私はKafkaにプッシュされたメッセージを深いストレージに保存する必要があります。私たちはAzureクラウドサービスを使用していますので、Azure BLOBストレージがより良い選択肢になると思います。私はKafka ConnectのシンクコネクタAPIを使用してデータをAzure BLOBにプ​​ッシュしたいと考えています。 KafkaのドキュメントではHDFSにデータをエクスポートするよう提案していますが、その場合はHadoopを実行するLinux VMが必要です。私の質問は、Azure BLOBストレージがJSONオブジェクトを格納する適切な選択肢であり、カスタムのシンクコネクタを構築することは、このケースでは合理的な解決策ですか?Azure Blobストレージ用Kafkaコネクタ

+0

カスタムシンクについては、それは ' s OK。現在、Azure BLOBストレージ用の公式シンクはありません。別の解決策が必要な場合は、Apache Flume(KafkaソースとAzure Sink)を試してみてください。参考までにこのリンクを参照してください:https://blogs.msdn.microsoft.com/bigdatasupport/2014/03/18/using-apache- flume-with-hdinsight / – NangSaigon

答えて

2

カスタムシンクコネクタは間違いなく動作します。 Kafka Connectはコネクターを差し込めるように設計されています。実際、コネクタの開発は完全に統合されています。 ConfluentのJDBCとHDFSコネクタは、2つのユースケースの人気のために最初に実装されましたが、さらに多くのものがあります(私たちが気づいているコネクタのリストを保持します)。

Azure BLOBストレージが適切なJSONオブジェクトについて言及しておきたいと思いますが、オブジェクトのサイズとAzureストレージのサイズがオブジェクトの数である&をうまく扱うかどうかだけ考えてください。他のオブジェクトストレージシステムでは、多数のオブジェクトを単一のBLOBに集約して多数のオブジェクトのパフォーマンスを向上させる必要があります(つまり、多くのJSONオブジェクトをサポートするファイル形式が必要な場合があります)。

関連する問題