私は、np.nansumのような機能を使用して既存のデータフレームからサブデータフレームを作成するための助けを探しています。 「ダン」(T-2,3,4,6,7) - nullでない場合、例えば、パンダクロス集計マトリックスnansum
dan ste bob
t1 na 2 na
t2 2 na 1
t3 2 1 na
t4 1 na 2
t5 na 1 2
t6 2 1 na
t7 1 na 2
の合計:私は非ヌル列和のマトリックス中にこのテーブルを変換します「STEは」2であると「ボブ」は「STEは」 'ダンのないヌル和である場合は5です。4.
dan ste bob
dan 0 2 5
ste 4 0 2
bob 4 1 0
任意のアイデアですか?
ありがとうございます!
私は、下記のマットの機能の修正版使用して終了:あなたのデータフレームは、多数の列を持っていない、この関数は、あなたがやりたいことと、かなりパフォーマンスであるべきと仮定すると、
def nansum_matrix_create(df):
rows = []
for col in list(df.columns.values):
col_sums = df[df[col] != 0].sum()
rows.append(col_sums)
return pd.DataFrame(rows, columns=df.columns, index=df.columns)
これはクロスタブでもドットプロダクトでもなく、実際にはナンサムでもないとは思いません。 –