2017-01-31 5 views
3

同じデータフレームからの2つの異なる列間の相関を計算します。データフレームから2つの列間の相関係数を計算する方法は?

Correlation_unemp_demvote=np.corrcoef(New_table['unemp'],   
New_table['demVote']) 

Correlation_unemp_demvote 

結果、次のように:本当の相関係数の定義を説明しているように、私は実際に、-1と1の間の値を取得するために期待していた

array([[ 1.  , 0.34167764], 
    [ 0.34167764, 1.  ]]) 

これは私が使用するコードです。私はちょうど得た結果を私に説明できますか?私はcorr()やcorrelate()のような相関関係に関連する関数もたくさん見てきました。どの方が使用する方が良いでしょうか?

おかげで、

答えて

5

pd.Series.corrは、あなたが望むものです。
は、この代わりに

Correlation_unemp_demvote = New_table['unemp'].corr(New_table['demVote']) 

df = pd.DataFrame(np.random.rand(10, 2), columns=list('AB')) 

df.A.corr(df.B) 

-0.1814956009745472 
を実行します。
関連する問題