これは申し訳ありませんが...確かにFAQですが、それは愚かな質問ですが、それは私を悩ませています。私は、このようななぜvarはRでcovのように動作しますか?
当然df <- data.frame(x=1:5,y=seq(1,50,10))
として、データフレーム内のすべての数値列の分散を取得したいと、私はものになるだろう
var(df)
代わりに私が望んたいものを私に与えてし、してみてください
x y
2.5 250
ように私はこの
x y
x 2.5 25
y 25.0 250
を取得します対角線に分散を有する
、および他の場所の共分散を含む。私は助け(var)を検索し、 "varは単なる別のインターフェースです"と読むと意味があります。分散はもちろん、変数とそれ自身の共分散です。出力は少し混乱しますが、私は対角に沿って読むことができます。または、diag(var(df))
,sapply(df, var)
、またはlapply(df, var)
を使用して、またはを繰り返しdf$x
とdf$y
に繰り返し呼び出すことによって、分散のみを生成することができます。
なぜですか?分散は日常的で基本的な説明的な統計であり、次に重要な意味を持ちます。それをデータフレームの列に適用することは、完全に、そして全く些細なことではないでしょうか?なぜ私は分散を求めただけで私に共分散を与えるのですか?ちょっと興味があるんだけど。これに関するコメントありがとうございます。
[This](http://stackoverflow.com/q/9424311/324364)の質問も参考になるかもしれません。 – joran