gzipped csvをダウンロードし、ディスクに保存せずにRオブジェクトとしてロードします。私は圧縮されたファイルでこれを行うことができますが、gzfile
またはgzcon
と動作するように見えません。URLから直接gzipped csvを読んでください。
例:
grabRemote <- function() {
temp <- tempfile()
download.file("http://dumps.wikimedia.org/other/articlefeedback/aa_combined-20110321.csv.gz", temp)
aap.file <- read.csv(gzfile(temp), as.is = TRUE)
unlink(temp)
return(aap.file)
}
Wikipedia article feedback data含む(小)GZ圧縮ファイルダウンロード(重要ではないが、しかし、ちょうどそれが巨大か極悪ないであることを示すために)。
私が使っているコードはうまくいきますが、一時ファイルを作成して破壊することによって非常に明白なものを見逃しているような気がします。
ええ私はあなたやJDがほぼ同じように答えていることをほぼ70%確信しています。私は実際にzipフォルダに関するあなたの以前の答えから 'tempfile'アイデアを得ました。しかし、私はgzfile/gzconを見つけることができません。これは、他のファイルや接続関連の関数とは異なる動作をしているようです。 –
これを蒸留できますか?私は実際に、ディスクスペースが乏しく、シミュレーション結果をgzipされたままにしていた1990年代初めに、gzipファイルから「ストリーミング」という同じテクニックを使用しました。したがって、 "gunzip"機能をCライブラリのfreadに透過的に取得する機能は、かなり古い学校であり、標準的です。 –
私はこれを答えとしてマークします。私はgzcon(より有望な角度のように思える)の周りをだまされた後、戻って自分自身に良い答えを与えるかもしれない。 –