0
でXMLを解析している間、私は私が私が解析できることを知っているスパーク
<root>
<bookinfo>
<time>1232314973</time>
<requestID>233</requestID>
<supplier>asd123</supplier>
</bookinfo>
<books>
<book>
<name>book1</name>
<pages>124</pages>
</book>
<book>
<name>book2</name>
<pages>456</pages>
</book>
<book>
<name>book4</name>
<pages>789</pages>
</book>
</books>
</root>
のようなXML構造を持っている情報を行にヘッダー情報を追加する方法books
のような:
val xml = sqlContext.read.format("com.databricks.spark.xml")
.option("rowTag", "book").load("FILENAME")
しかし、私は希望のようなヘッダー情報を各行に追加すると便利です。
この「headerinfo」をファイルを2回ロードせずにsparkを持つすべての行に追加し、グローバルvars/valsに情報を格納する方法はありますか?
ありがとうございます!
病気、助けのおかげで答えを投票しました。 – kf2