SparkでXMLファイルを解析する方法を知る必要があります。私はカフカからストリーミングデータを受信しており、そのストリームデータを解析する必要があります。Apache SparkでXMLデータを解析する
directKafkaStream.foreachRDD(rdd ->{
rdd.foreach(s ->{
System.out.println("&&&&&&&&&&&&&&&&&" +s._2);
});
と結果:
<root>
<student>
<name>john</name>
<marks>90</marks>
</student>
</root>
これらのXML要素を渡す方法をここで
は、データを受信するために私のスパークのコードですか?
あなたはこれに関する前の質問を検索しましたか?そのような:http://stackoverflow.com/questions/33078221/xml-processing-in-spark –
@ Binary Nerd、応答ありがとう。私のスパークアプリケーションは、行単位でデータを読み込んでいます。ですから、私は開始要素と終了要素を使わずに行ごとに解析する必要があります。 – user6325753