2016-04-13 9 views
-2

私は200以上のCSVファイルを持っています。各ファイルには、150個以上の列と1000個の行があります。各ファイルには製品名が付けられています。 各ファイルは、データセットに、異なる列のさまざまなカテゴリに対して異なる項目のフラグを提供します。列の1つは、カテゴリ全体の各アイテムの合計使用量です。以下は、データセットのサンプルです:複数のファイルにまたがる機能を実行する

Values A B C 
    1  Y 
    2   Y 
    3  Y Y 
    4   Y 

私は昨日の質問をしていた、と私は次のような結果を取得する方法についてのヘルプを受けました。

 Count Sum 
A  2  4 
B  1  2 
C  2  7 

は基本的に私は「Yがあるたびの使用上の欄から私に合計を与えるために私にA、B、およびCのための「Y」、および合計の列の数を与えるためにCount列をしたいです"列A、B、およびCの

ステップ2で質問があります。 - すべてのファイルをフォルダに持ってきました。私がしたいことは、上記の結果を使用して各ファイルに適用し、ファイルとカテゴリで回答をグループ化することです。たとえば、

File 1 Count A Sum A Count B Sum B Count C Sum C 
File 2 Count A Sum A Count B Sum B Count C Sum C and so on. 

Rでこれを行うにはどうすればよいですか?私はフォーラムを検索し、ループが役立つことを発見しましたが、結果を1つにまとめる方法がわかりません。

答えて

0

再現可能な例を共有し、元の質問へのリンクに疑問がある場合は、本当に役立ちます。

ここにあなたの役に立つ情報がいくつかあります。次に、特定の障害ブロックがあるときに質問をやり直すことをお勧めします。

Looping over files

filenames = dir(pattern="*01.csv") 
for(i in 1:length(filenames)) 
{ 
    ... 

Merging data

これは本当に良いアイデアではありませんが、あなたはこのようにそれをやってみたかった場合、私はあなたが試すことができますね。

for (i in 1:10) { 
    df <- rbind(df, data.frame(x = i, y = toString(i))) 
} 

注意していることあなたのコードにはもう1つの問題があります:

あなたは文字が要素に変換されないようにするにはstringsAsFactorsを使用してください。

+0

私はファイルをループしてみましたが、何か不足しています。私はそれを実行するとき、それは何かをしているように見えますが、私は結果を見ていません。また、どのように結果が各ファイルによって返されますか? – jalsa

関連する問題