2017-04-01 6 views
3

私はscipyを初めて使用しています。私は文字列の最大値を取得しようとしています。ストア所有者データの最初の数行ここScipy stats.modeが最大値を返していません

import pandas as pd 
    import numpy as np 
    from scipy.stats import mode 

    print ("Maximum Occurence of Store Owner " + str(mode(df_units["StoreOwner"], nan_policy='omit').mode[0])) 

次のとおりです:上記のコードで

0 Muhammed MacIntyre 
    1   Barry French 
    2   Barry French 
    3   Clay Rozendal 
    4  Carlos Soltero 

私は、最大発生した店のオーナー値を取得しようとしています。ここ

は私のコードですデータフレームから。しかし、それはすべての価値をそのまま返しています。あなたが行うことができ

ser.value_counts()[ser.value_counts().index.max()] 

答えて

0

pdf = pd.DataFrame(dict(A=['a', 'a', 'b', 'c', 'd'])) 
pdf.A.value_counts().idxmax() 

これはあなたに発生した値を与える

0

と仮定すると、あなたのデータは、次の方法で最も頻繁に発生する文字列を取得することができ、パンダSeriesserと呼ばれていますデータフレームのA列に最も頻繁にある。pdf

関連する問題