2017-02-09 4 views
0

私はそうのようなパンダのデータフレームを持っている:私はCAT1と列CAT3、NUM1とNUM2 間またはCAT1及びNUM1とNUM2 間またはCAT2とCAT1との間の相関関係を調べたいPythonではどのように2つ以上の変数を複数の列間の相関関係ですか?

id cat1 cat2 cat3 num1 num2 
1  0  WN  29  2003 98 
2  1  TX  12  755  76 
3  0  WY  11  845  32 
4  1  IL  19  935  46 

、CAT3、 num1、num2

私がdf.corr()を使用すると、データフレーム内のすべての列間の相関が得られますが、上記の選択列間の相関関係を見たいと思います。

Pythonのパンダでどうすればいいですか?

あなたの回答には、事前に感謝します。

+1

'df [['Cat1'、 'cat3']]。corr()'など – DyZ

答えて

2

私は次のことを試してみました、それが働いた:あなたがあなたのデータセット内の変数の非常に高い数値を持っていたときに必要に基づいて列を選択する

features1=list(['cat1','cat2','cat3']) 
features2=list(['Cat1', 'Cat2','num1','num2']) 
df[[features1]].corr() 
df[[features2]].corr() 

良い方法を。

関連する問題