私は選挙データでいっぱいのCSVファイルを作成しています。私はこのような「勝者」と呼ばれる新しい列を、作成するために、パンダのidxmax()関数を使用idxmax()pandasとの等価
city party1 party2 party3
0 city1 50 107 114
1 city2 181 323 326
2 city3 26 28 75
3 city4 32 47 59
4 ciy5 8 21 21
:私の生のサンプルは、として表すことができる
mydf['winner'] = mydf[['party1','party2','party3']].idxmax(axis=1)
私の目標が決定することでしたどちらの当事者が各都市で最初の位置にあったのかここでの結果:party2とparty3が同じスコアを持っているので、最後の生の
city party1 party2 party3 winner
0 city1 50 107 114 party3
1 city2 181 323 326 party3
2 city3 26 28 75 party3
3 city4 32 47 59 party3
4 ciy5 8 21 21 party2
勝者の値は、falseです。
関数idxmaxの2つの値の等価性で1つの例外を含めることは可能ですか?その後、sum
、行ごとにそれらをsubset
DataFrame.max
との値を比較し、どこ最大の重複がある1
として高い価値があるため
だから、勝者の列の価値はどうあるべきですか?文字列party2とparty3の連結 – ayhan
Personalityでは、「平等」のようなものが最高です! – Raphadasilva