データフレームdf1に列(col1、col2、col3)のセットがあります データフレームdf2に別の列セット(col4、col5、col6)があります この2つのデータフレームに同じ数の行。カテゴリの列間の相関を実行する方法
df1とdf2のペア間相関を行う相関テーブルを生成するにはどうすればよいですか?
表は、私がdf1.corrwith(df2)
を使用
col1 col2 col3
col4 .. .. ..
col5 .. .. ..
col6 .. .. ..
のようになります、必要に応じて、テーブルを生成していないようです。
私はここで似たような質問をしています: How to perform Correlation between two dataframes with different column names しかし今はカテゴリカルを扱っています。
もしそれが直接比較できないのであれば、(get_dummiesのように)比較可能な標準的な方法がありますか?すべてのフィールドを自動的に処理する(すべてがカテゴリであると仮定して)、その相関関係を計算するより速い方法です。
get_dummiesを使用しています。相関関数をそれらに適用することができます。 – epattaro
ピアソン相関では、データを数値にする必要があります。バイナリデータで計算した相関関係は意味を持ちません。カテゴリデータに関する関連付けの措置を探してください。 – ayhan