とマージする3つの変数、日付、ID、価格の3つのファイルがあります。私は、日付によってそれらを統合したいと思いますので、1つが私の現在のファイルには、次のとおりです。.csvファイルをR
date ID Price
01/01/10 A 1
01/02/10 A 1.02
01/02/10 A 0.99
...
...
私はIDがA、BおよびCについては、以下のいずれかのように見えますマージされたファイル(価格のためのPr)を取得したいと思い:
date Pr.A Pr.B Pr.C
01/01/10 1 NA NA
01/02/10 1.02 1.2 NA
01/03/10 0.99 1.3 1
01/04/10 NA 1.23 2
01/05/10 NA NA 3
一部の日付では価格がないことに注意してください。その場合はNAです。
私の現在のアプローチは動作しますが、私は少し不器用です。
setwd('~where you put the files')
library(plyr)
listnames = list.files(pattern='.csv')
pp1 = ldply(listnames,read.csv,header=T) #put all the files in a data.frame
names(pp1)=c('date','ID','price')
pp1$date = as.Date(pp1$date,format='%m/%d/%Y')
# Reshape data frame so it gets organized by date
pp1=reshape(pp1,timevar='ID',idvar='date',direction='wide')
考えられるアプローチはありますか?
後藤http://stackoverflow.com/questions/1562124/merge-many-data-frames-from-csv-files –
ワンノート - リンク先のファイル ' "a1.csv"'いくつかの余分が含まれていますカンマで区切られた、データのない行。私は手でそれらを削除したのではなく、答えでRコードを掘り起こすのではなく、それを削除しました。 –
私が実際にあなたが「改造」したことは、ここではかなり良い選択だと思っています。 – joran