datファイルには、実際のデータの前にいくつかの行の追加情報があります。 skip
引数でそれらをスキップ:
read.table("http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat",
header=TRUE, skip=3)
あなたがデータセットに慣れていない場合は、これをチェックする簡単な方法は、まず以下のように、いくつかの行をチェックするためにreadLines
を使用することです:
ここ
readLines("http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat",
n=10)
# [1] "Ozone data from CZ03 2009" "Local time: GMT + 0"
# [3] "" "Date Hour Value"
# [5] "01.01.2009 00:00 34.3" "01.01.2009 01:00 31.9"
# [7] "01.01.2009 02:00 29.9" "01.01.2009 03:00 28.5"
# [9] "01.01.2009 04:00 32.9" "01.01.2009 05:00 20.5"
、実際のデータは[4]
で始まるので、最初の3行をスキップすることがわかります。
更新
あなたが本当にだけValue
列を望んでいた場合は、でそれを行うことができ:再び
as.vector(
read.table("http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat",
header=TRUE, skip=3)$Value)
、readLines
は、私たちは、実際の名前を把握助けるために有用ですインポートする列
しかし、私は表示されません多くのは、全体のデータセットを読み込んで後で抽出することよりも有利です。
+1 [再生可能な例](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)の場合+1。 – Andrie