XMLデータ 解析のXMLファイルは、データフレーム
<HealthData locale="en_US">
<ExportDate value="2016-06-02 14:05:23 -0400"/>
<Me HKCharacteristicTypeIdentifierDateOfBirth="" HKCharacteristicTypeIdentifierBiologicalSex="HKBiologicalSexNotSet" HKCharacteristicTypeIdentifierBloodType="HKBloodTypeNotSet" HKCharacteristicTypeIdentifierFitzpatrickSkinType="HKFitzpatrickSkinTypeNotSet"/>
<Record type="HKQuantityTypeIdentifierStepCount" sourceName="Ryan Praskievicz iPhone" unit="count" creationDate="2014-10-02 08:30:17 -0400" startDate="2014-09-24 15:07:06 -0400" endDate="2014-09-24 15:07:11 -0400" value="7"/>
<Record type="HKQuantityTypeIdentifierStepCount" sourceName="Ryan Praskievicz iPhone" unit="count" creationDate="2014-10-02 08:30:17 -0400" startDate="2014-09-24 15:12:13 -0400" endDate="2014-09-24 15:12:18 -0400" value="15"/>
<Record type="HKQuantityTypeIdentifierStepCount" sourceName="Ryan Praskievicz iPhone" unit="count" creationDate="2014-10-02 08:30:17 -0400" startDate="2014-09-24 15:17:16 -0400" endDate="2014-09-24 15:17:21 -0400" value="20"/>
</HealthData>
Rコード
> library(XML)
> doc="\\pathtoXMLfile"
> list <-xpathApply(doc, "//HealthData/Record", xmlAttrs)
> df <- do.call(rbind.data.frame, list)
> str(df)
に入る私は、上に示したXMLデータのサンプルを取り、データフレームにロードしようとしていますRの各レコードの名前、すなわち、Type、sourceName、unit、endDate、列ヘッダーの値、レコードの各値、つまり2014-09-24 15:07:11 -0400,7の各レコードの値としてのcountデータフレーム。
df <- do.call(rbind.data.frame, list)
これは終わりですが、列見出しのすべての値もバインドされているように見えます。 View(df)
またはstr(df)
の場合は、私の言いたいことが分かります。列ヘッダー名としてレコード変数名を使用するにはどうすればよいですか?
おかげで、 ライアン
私が提供したテストデータのために完璧に動作したため、タグを取得することができます。私が戻って完全なデータセットに適用しようとしたとき、私は、7列ではなく9列のレコードがあることに気付きました。 '動作しませんでした。何か案は? –
共通の属性またはすべてを保持したいと思っていますか?あなたはどの属性を保持しておくべきかを事前に知っていますか? – Parfait
ええ私はベクトルから9行すべてを保持したいだけで、7行のベクトルのためのNAを持つことができます。 –