2017-10-15 5 views
-1

私は高校生がに登録された大学を保存するデータフレームを持っている。Pandasのvalue_countメソッドがゼロカウントを返すのはなぜですか?

School  Student_id 
    A    111 
    A    112 
    B    223 

私はユニークな大学のリストと、各大学に在籍する学生の数を見ることがvalue_counts()関数を使用しています。しかし、このリストには、0カウントの大学がかなり含まれています。それはなぜ可能ですか?学校全体がカウントされるデータセットに表示されなければならないという事実に基づいて、価値観概念全体が構築されているわけではありませんか?私はここで何が欠けていますか?

dtypeは文字列です。

コード:

ncee_sample_2005.clg.nunique() # Numer of unique colleges 
49 
ncee_sample_2005.clg.value_counts() # Visually check the college list 
哈尔滨工业大学   9 
吉林大学     7 
哈尔滨工程大学   7 
浙江大学城市学院   0 
浙江大学     0 
+0

'df.dtypes'は何ですか? – jezrael

+0

更新を参照してください...... –

+0

そしてdownvoteについては、説明してください。 –

答えて

0

列がカテゴリである場合には欠けているカテゴリの0を追加しているので、それは、可能である - hereを確認してください。

print (df['Student_id'].dtype) 
category 

print (df['Student_id']) 
0 111 
1 112 
2 223 
Name: Student_id, dtype: category 
Categories (4, int64): [111, 112, 223, 100] 

s = df['Student_id'].value_counts() 
print (s) 
223 1 
112 1 
111 1 
100 0 
Name: Student_id, dtype: int64 
関連する問題