2017-03-29 11 views
0

生のバイナリデータを含むデータフレームからの限界確率分布を計算したいと思います。私は簡単な方法があると確信していますが、私はそれのための関数を見つけることができないようです。何か案は? 私はあなたが使用することができます0Rのデータフレームからの限界確率を計算する

set.seed(1234) 
respondent <- 1:1000 
red <- sample(0:1, 1000, replace=T) 
blue <- sample(0:1, 1000, replace=T) 
green <- sample(0:1, 1000, replace=T) 
black <- sample(0:1, 1000, replace=T) 
grey <- sample(0:1, 1000, replace=T) 

my.new.df <- data.frame(respondent, red ,blue,green,black,grey) 
lapply(my.new.df[,2:6],sum) 
$red 
[1] 518 

$blue 
[1] 485 

$green 
[1] 515 

$black 
[1] 481 

$grey 
[1] 508 

答えて

0

ような結果が一つと考えることができるバイナリ変数のデータフレームなし結果の簡単な例を添付しています:

colMeans(my.new.df[,2:6]) 

または@motoとしてあなたは試していましたが(もっとシンプルです):

lapply(my.new.df[,2:6], function(x) mean(x)) 
関連する問題