0
同じフォーマットを使用していると思われる80,000のXMLファイルがあります。しかしながら、これは明らかではない。このため、ファイル内に存在するすべてのノードと子を識別しようとしています。リスト内のすべての可能な親と子を特定します
XMLパッケージを使用してリストとしてXMLファイルをインポートしました。以下では、入力と希望する出力について説明しました。
入力(リストのリスト):
XML1 <- list(name = "Company Number 1",
adress = list(street = "JP Street", number = "12"),
product = "chicken")
XML2 <- list(name = "Company Number 2",
company_adress = list(street = "House Street", number = "93"),
invoice = list(quantity = "2", product = "phone"))
XML3 <- list(company_name = "Company Number 3",
adress = list(street = "Lake Street", number = "1"),
invoice = list(quantity = "2", product = "phone", list(note = "Phones are refurbished")))
出力(葉の出現の数とファイル間のツリー構造):
List of 5
$ name : num 2
$ company_name : num 1
$ adress :List of 2
..$ street: num 2
..$ number: num 2
$ company_adress:List of 2
..$ street: num 1
..$ number: num 1
$ invoice :List of 3
..$ quantity: num 2
..$ product : num 2
..$ :List of 1
.. ..$ note: num 1
$ product : num 1
この線に沿って何かを行うことができますパッケージがあります、または自分でこれを行う関数を書く必要がありますか?