2
私は以下のようなデータフレームを持っている:python pandasの特定の列の値を数えるには?
df1_data = {'sym' :{0:'AAA',1:'BBB',2:'CCC',3:'AAA',4:'CCC',5:'DDD',6:'EEE',7:'EEE',8:'FFF'},
'identity' :{0:'AD',1:'AD',2:'AU',3:'AU',4:'AU',5:'AZ',6:'AU',7:'AZ',8:'AZ'}}
私は私のデータフレーム内SYM列をチェックしたいです。私の意図は、2つの異なるファイルを生成することです.1つは異なる2つの列を異なる順序で含み、2つ目のファイルにはsym、sym_count、AD_count、AU_count、neglected_countの各列が含まれています。
編集1から
私は(AD & AU)以外のアイデンティティを避けたいです。どちらの出力ファイルでも、私はAD & AUの結果を望んでいません。 neglected_countカラムはオプションです。
期待Result-
result.csv
sym,identity
AAA,AD
AAA,AU
BBB,AD
CCC,AU
CCC,AU
EEE,AU
result_count.csv
私はPythonのパンダに計算のようなタイプを実行するにはどうすればよいsym,sym_count,AD_count,AU_count,neglected_count
AAA,2,1,1,0
BBB,1,1,0,0
CCC,2,0,2,0
EEE,2,0,1,1
?
それは動作します。 result.csvのソリューションですか? – kit
result_count.csvとresult.csvの編集1.要件が少し変更されていますを参照してください。私はresult.csvがresult_count.csvではないと言った。注意深く読んでください。 – kit
私の解決策をチェックしてください。 – jezrael