Endnoteのxml出力をRデータフレームに変換し、各子ノードを別々の列に変換したいと考えています。endnote XMLをRデータフレームに変換する
同様の質問は以前にhereと尋ねられましたが、回答者は複数の著者やキーワードなどのレコードの問題を解決しませんでした(問題は記載されていましたが)。
寄稿者、定期刊行物、キーワード(複数の値を返すことが多い)などのフィールドにどのようにセパレータ(たとえば;
例のデータは以下のとおりです。見て分かるように、上記のフィールドのエントリは、セパレータを付けずに複数のエントリが追加されています。最初のリストに変換しようとすると、forループを介してエントリを反復を含む -
library(XML)
library(RCurl)
urldata<-"https://gist.githubusercontent.com/nickbond/4f5a600836bf43a60d99e2a63e5a62de/raw/2088f8065eebbfe9e57c761ffa801b0a18588498/endnote.xml"
endnotexml<-xmlParse(getURL(urldata))
xmlToDataFrame(getNodeSet(endnotexml,'//*/record'))
Iは、アプローチの範囲を試みました。後では、私が持っている事件の数があまりにも遅かった。どんな支援も非常に感謝しています。
ありがとうございました。これは説明したとおりに機能し、必要に応じて追加のノード/列を追加するのは簡単なプロセスです。どうもありがとう!! – nickb