私はXMLデータベースで新しくなっています。XMLをデータフレームに構文解析
私は自分の問題を説明しようとします。
分析のためにダウンロードしようとしているメキシコの政府のページのxmlファイルにデータベースが保存されています。
データが見つかるページはこちらです。
直接ダウンロードリンクは、私が外部リポジトリのようなものであると考え、これです。敬具私は知らない。
https://publicacionexterna.azurewebsites.net/publicaciones/prices
あなたは上記のリンクをクリックすると、XML形式のデータベースが自動的にダウンロードされます。
このデータベースは、小売業者からのメキシコのガス価格で、全国の小数点以下の桁数です。
データベースをダウンロードしてWindowsの.xlsファイルに貼り付けてから、.csvアーカイブを貼り付けて分析用のR環境に移動することができます。
一般的な問題は、ページから私のR環境に直接ダウンロードしようとしているときに、解析を実行できる構造化されたデータベース形式を取得できません。
重複する行が取得されているため、データの各レベルのすべての属性を抽出できません。
これは私の自己で書くことができ、インターネットでヘルプを探していたスクリプトです。
# CRE FILES
library(easypackages)
my_packages <- c("rlist","readr", "tidyverse", "lubridate", "stringr",
"rebus", "stringi", "purrr", "geosphere", "XML", "RCurl", "plyr")
libraries(my_packages)
# Link de descarga de documentos
link1 <-(https://publicacionexterna.azurewebsites.net/publicaciones/prices")
# First we load the xml file to the enviroment
data_prices <- getURL(link1)
xmlfile <- xmlParse(data_prices)
class(xmlfile)
xmltop <- xmlRoot(xmlfile)
base <- ldply(xmlToList(xmltop),data.frame)
問題は、日付を行ではなく別の列として欲しいということです。あなたの答えをありがとう。
あなたが働いて、最小限のRコード – hrbrmstr
申し訳ありませんああ、私は私がつけたコードで十分だと思った投稿場合は、おそらくより多くの助けを得る、私が説明する方法がわからないと思いますが、私はしようとするだろう。 –