私は困難なデータ操作の問題のような感じがしており、何かガイダンスを得ることを望んでいます。strpslit文字配列とデータフレームに同時に変換する
私が扱っていますいくつかの問題がありますdput(test)
c("<play quarter=\"1\" oncourt-id=\"\" time-minutes=\"12\" time-seconds=\"0\" id=\"1\"/>", "<play quarter=\"2\" oncourt-id=\"\" time-minutes=\"10\" id=\"1\"/>")
test
[1] "<play quarter=\"1\" oncourt-id=\"\" time-minutes=\"12\" time-seconds=\"0\" id=\"1\"/>"
[2] "<play quarter=\"2\" oncourt-id=\"\" time-minutes=\"10\" id=\"1\"/>"
desired_df
quarter oncourt-id time-minutes time-seconds id
1 1 NA 12 0 1
2 3 NA 10 NA 1
:
- 文字列 "ここに私の現在のアレイは、私が取得したいと考えてどのようなデータフレームだけでなく、どのように見えるかのテストバージョンでありますテストには何もないはずのバックスラッシュがありますが、この形式のgsub( "\"、 ""、test)でgsubを使うのは難しかったです。
- テスト中のすべての要素が同じ数のエントリを持っているわけではありません.2番目の要素にはtime-secondsがないことに注意してください。データフレームの場合、NAを返すことをお勧めします。
私はstrsplit(test、 "")を使って、異なる列のエンティティの間だけに存在するスペースを最初に分割しようとしましたが、扱いにくいリストのリストが返されました。
これは 'XML'と似ていますか? 'XML'ライブラリで解析するのはなぜですか? – salient