2016-06-21 5 views
0

にオンラインJSONを読んだとき、私はRで以下のコードを通じてRにオンラインJSONデータを読み取ろうと取り残さ:データはR

library('jsonlite') 

address<-'https://data.cityofchicago.org/resource/qnmj-8ku6.json' 

sample<-fromJSON(address) 

コードを実行すると、テーブルの適切なフォーマットで結果を持っていませんでした。しかし、最初の都市ポータルデータベースは200,000を超える観測値を有していたのに対し、1000の観測値しか生成しなかった。私は、データセット全体をダウンロードするために何を修正するべきかわかりません。助けてください。

+0

本当にですか? 'https:// data.cityofchicago.org/resource/qnmj-8ku6.json'ページに行き、最後までスクロールして' id'フィールド(9909096)を見てください。 'tail(sample)' - 'id'フィールド(9909096) – SymbolixAU

+0

"オリジナル都市ポータルデータベース "へのリンクとは何ですか? – SymbolixAU

+0

元のウェブサイト:https://data.cityofchicago.org/Public-Safety/Crimes-2014/qnmj-8ku6 – lnx

答えて

0

間違ったリンクを使用してデータを取得しています。あなたはそれが簡単にすぐに作業できるようにする.CSVとして、それを取得したいことがあり、が「輸出」

library(jsonlite) 

address <- "https://data.cityofchicago.org/api/views/qnmj-8ku6/rows.json?accessType=DOWNLOAD" 
sample <- fromJSON(address) 

length(sample) 
# [1] 

length(sample[[2]]) 
# [1] 274228 

に行くことによって、正しいリンクを見ることができますか?

address <- "https://data.cityofchicago.org/api/views/qnmj-8ku6/rows.csv?accessType=DOWNLOAD" 
sample_csv <- read.csv(address) 

nrow(sample_csv) 
# [1] 274228 

str(sample_csv) 
# 'data.frame': 274228 obs. of 22 variables: 
# $ ID     : int 10512552 10517063 10517120 10518590 10518648 
# $ Case.Number   : Factor w/ 274219 levels "HA107183","HA156050",.. 
# $ Date    : Factor w/ 112977 levels "01/01/2014 01:00:00 AM",.. 
# $ Block    : Factor w/ 27499 levels "0000X E 100TH PL",.. 
# $ IUCR    : Factor w/ 331 levels "0110","0141",.. 
# $ Primary.Type  : Factor w/ 33 levels "ARSON","ASSAULT",.. 
# $ Description   : Factor w/ 310 levels "$500 AND UNDER",.. 
# ... etc