こんにちは私は処理するCSVファイルがたくさんあります。各ファイルはアルゴリズムの実行によって生成されます。データフレームをRに統合
CSV1:
index value
1 1 1
2 2 1
3 3 1
4 4 1
5 5 1
CSV2:
index value
1 4 3
2 5 3
3 6 3
4 7 3
5 8 3
は今、私はこのように、これらのCSVデータを集計したい:
私のデータは、常に1つのキーと、このような値を持っています両方のファイルに同じキーが含まれている場合結果の行には、ファイルshare(5)と両方の値の平均((1 + 3)/ 2 = 2)の両方のキーが含まれている必要があります。 1つのファイルにキー(たとえば2)が含まれている場合、この行は結果テーブルに追加されます(key = 2、value = 1)。このような
何か:まず
index value
1 1 1
2 2 1
3 3 1
4 4 2 (as (1+4)/2 = 2)
5 5 2 (as (1+4)/2 = 2)
6 6 3
7 7 3
8 8 3
データのみを連結して、私はrbind()
が仕事をしていませんと思ったが、それは値を集計しません。どのように私はRでそれを達成することができますか?
'rbind'、次に' aggregate' – James
これはおそらく、2つの別々のステップで行う必要があります - 1)値を1つの構造体(rbindを使って行ったもの)と2)インデックスに基づいて集計します。あなたはddply(plyrパッケージから)やtapplyやaggregateのようなものを使って簡単にステップ2を行うことができます。 – Dason
'aggregate(。index、data = rbind(data1、data2)、mean)を使用しています。 –