大きなXMLファイルを解析してRデータフレームにしようとしています。 XMLの構造は不均一であり、必ずしもすべての要素を含むとは限らず、ノードごとに2つ以上の複製要素が含まれることもあります。Rデータフレームへの不均一なXMLの解析
XMLは次のとおりです。
<root>
<members>
<member>
<id>1</id>
<educations>
<education>
<institution>Sydney University</institution>
<program>Masters of Science</program>
<start-date>2010</start-date>
<end-date>2015</end-date>
<description></description>
</education>
<education>
<institution>UTS</institution>
<program>Bachelor of Science</program>
<start-date>2004</start-date>
<end-date>2008</end-date>
</education>
</educations>
</member>
<member>
<id>2</id>
</member>
<member>
<id>3</id>
<educations>
<education>
<is-current>true</is-current>
<institution>Monash Univeristy</institution>
<start-date>2010</start-date>
</education>
</educations>
</member>
</members>
</root>
所望の出力テーブルには、各メンバーと彼らの教育・ブロックの重複のIDを持っているでしょう。したがって、ID1は教育期間ごとに2行を持ち、ID3はちょうど1になります。
xmlToList()を使用すると、過剰な列が作成され、各子ノードのIDを複製する方法が見つかりません。
ありがとうございました。これはうまくいきます。使用する名前を手動で指定する必要がありますが、速度に関してはうまく機能します。再度、感謝します。 – EwenM