2016-10-08 32 views
0

XML dataKafka topicに送信しようとしています。Kafka 0.9.0 version Java APIを使用しています。0.9.0 versionから、より良いパフォーマンスを得るためにJava APIの代わりにJava APIを使用することを提案しています。XMLデータをカフカのトピックに送信する最も良い方法は何ですか?

http://kafka.apache.org/090/documentation.html#producerapi

私のXMLファイルは約5 MB data持って、私は、XMLファイルを読み込み、文字列として変換し、カフカトピックにその文字列を送信するために使用できるXML APIとは何か。

また、XMLをJSONというデータに変換して、カフカに送信することはできますか? XMLデータを複数の少量のデータに分割してカフカトピックに送信することも検討すべきですか?

+0

あなたの質問は「ファイルを文字列に読み込む方法」です。そのファイルのフォーマットは本当に問題ではありません –

+0

これは、事実ではなく意見に基づいて答えを与える質問のように聞こえます。あなたはそれを言い換えることができますか? – Chewtoy

+0

@ cricket_007:私の質問はKafka特有のもので、xmlをstringまたはxmlからjsonに変換するだけでなく、XMLデータを効果的に処理する方法 – Shankar

答えて

1

XMLを読み書きするAPIは、プログラマ/環境に依存します。さらに、Apache Kafkaは、単純なキー/バリューモデルを超えてイベントデータの特定のフォーマットを強制しません。 XML、JSON、Avro、その他のデータフォーマットでも同様に機能します。一貫した方法で使用する必要がある場合は、XML、JSONなどの任意の形式を使用することをお勧めします。 Kafkaを使用して新しいプロジェクトを開始する場合は、パフォーマンス、使いやすさ、プログラミング言語のサポートなどを考慮して、適切なシリアルフォーマットなどを選択して使用することが必要です。ストリームデータの最も成功したフォーマットの1つです。

関連する問題