0
私は以下のようなデータフレームを持っています。 次のようなカウントを取得してデータプロファイルを構築したいと考えています。Python Pandas Dataframe複数の列の値を使用してフィルタリングした後の行の数を取得します
1)ユニーク学生のID(生徒数)のカウント 私の答えは動作します:ユニークな学生のID 国際= N以外の留学生の(数)の
print(len(df['Student ID'].unique()))
2)のカウント
私の答えは動作しません:print(len(df1.loc[(df1['Student ID'].unique())['International Student'] == N]))
3)国際= Nユニークな学生IDの数& ATARがATARが
0-50の間にいくつかの他の質問であるユニークな学生IDの(ATARを持っている非留学生の数)
4)のカウントnullではない:
5)どうすればいいですか新しいデータフレームを作成するユニークな学生IDと他のすべての列を持つ学生IDごとにすべての行を削除してから
2〜5番の質問には非常に感謝します。新しいdf1
の見返り1列のboolean indexing
とloc
(Series
)との主ニードSeries.nunique
Student_ID International marks ATAR
119 N 60 80
119 N 70 80
119 N 75 80
129 Y 78 75
129 Y 60 75
155 Y 85
155 Y 80
問題ありませんが、それは私の大学とshorcutsがBA STUです。 ) – jezrael
oh wow lol ... done –
:私にとっては、BA(ビジネスアナリティクス)の学生を意味します。ありがとう。ああも –