2016-11-03 2 views
2

私がしようとするのは、XMLパーサーを使用してStringを解析することです。spark xml parserを使用してXMLの文字列をscalaで解析する方法は?

私はScalaでスパークを使用して解析するには、この方法を見つける:

val df = sqlContext 
    .read 
    .format("com.databricks.spark.xml") 
    .option("rowTag", "book") 
    .load("books.xml") 

私が解析する必要がどのようなので、文字列をロードするための任意のオプションは文字列ではなく、ファイル

があるさ(ファイルパスではありません)?

ありがとうございます!スパーク(火花から2.0+)スパークセッション -

答えて

0

val df = new XmlReader().xmlRdd(spark.sqlContext(), xmlStringRDD); 

次のようにそしてRDDを使用し、以下のような文字列から

val xmlStringRDD = sc.parallelize(List("Your xml string")) 

をRDDを作成します。

注意してください:をこのxmlRdd方法は推奨されるように議論された、今それが動作 ためので、将来的にはない可能性があります。

関連する問題