2017-07-21 5 views

答えて

0

機能が不要 - pandasには既に目的を達成するための実装があります!

import pandas as pd 

df = pd.read_csv('test.csv') 

counts = df['region'].value_counts() 
least_common = counts[counts == counts.min()].index[0] 

least_common_df = df.loc[df['region'] == least_common] 

least_common_df今ある:私が正しくあなたを理解していた場合はそうは以下のように、私は少なくとも共通領域を表すデータフレームを得るでしょう

department,sales,region 
sales,26,midwest 
finance,45,midwest 
tech,69,west 
finance,43,east 
hr,20,east 
sales,34,east 

... test.csv、私は以下のCSVファイルを持っていたと仮定:

department sales region 
2  tech  69 west 

最も一般的でない地域の部門の頻度を取得するために、私はあなたに任せます。 (私は既に地域のための周波数を得る方法を示しました)

関連する問題