2016-09-11 9 views
1

私は私を助けるかもしれない何かを見つけようとしましたが、できませんでした。私の質問にすでに答えられていれば、誰かが私にそれをリンクすることができれば感謝します。Pandas Dataframe Transpose

私は、行ごとの機能を持つパンダのデータフレームを持っています。たとえば:

Patient_ID Feature_Id Feature_Value 
0   3   10   0.30 
1   3   50   0.20 
2   3   60   1.00 
3   4   10   0.25 

私は、列単位の機能(パンダで、本質的に列)に変換する必要がある - 何かを以下のように:

Patient_Id 10 50 60 
     3 0.30 0.2 1.0 
     4 0.25 Nan Nan 
+0

@ayhan申し訳ありませんが、ここでテーブルをどのようにフォーマットしたかを教えてください。 – Ahsan

+1

ここにDataFrameを直接貼り付けて、DataFrameが選択されている間に '{}'をクリックすることができます。それをコードとしてフォーマットします。 '|'文字を削除して空行を使用しました。それだけです。 [編集](http://stackoverflow.com/posts/39437387/edit)をクリックすると、現在のマークダウンを見ることができます。 – ayhan

答えて

1

あなたが試みることができるpd.pivot_table

In [16]: pd.pivot_table(df, index='Patient_ID', values='Feature_Value', columns='Feature_ID') 
Out[16]: 
Feature_ID 10 50 60 
Patient_ID     
3   0.30 0.2 1.0 
4   0.25 NaN NaN 

1つ以上のエントリが存在する場合(あなたの例にない場合)は、aggfuncパラメータを使用することができます(デフォルト平均を計算することです)。

+0

フィーチャー選択手法は、行単位の列で実行する必要があります。私はそれをするのが難しいと思っているので、それらを列に変換します。行列が非常に疎であるため、理想的ではありません。 Feature_Id列にある間にフィーチャの相関統計を見つける方法はありますか? – Ahsan

+0

@Ahsan正確に相関関係を見つけようとしていることを理解しているかどうかはわかりません。 'df.T.corr()'を試して、それがあなたがやろうとしていることではないかどうかをさらに指定できますか? –

+0

Feature_Id列には、特定の科目を分類するためのすべての機能があります。何千もの機能があり、私は正しいラベルの選択にもっと貢献するものを選択できると思っています。ラベルはバイナリです。したがって、おそらく、フィーチャと従属変数(ラベル)との間の相関関係を見つけることが役立つ可能性があります。とにかくそれは今のところアイデアです。 – Ahsan