0
3つの列(部門、販売、地域)を持つデータフレームがあり、最小共通領域からのすべての行を表示するメソッドを記述したいと思います。次に、最小共通領域で表される部門の頻度を数える別の方法を書く必要があります。これをどうやって行うのか分かりません。最も一般的な列文字列でデータフレーム行を表示するPythonメソッド
3つの列(部門、販売、地域)を持つデータフレームがあり、最小共通領域からのすべての行を表示するメソッドを記述したいと思います。次に、最小共通領域で表される部門の頻度を数える別の方法を書く必要があります。これをどうやって行うのか分かりません。最も一般的な列文字列でデータフレーム行を表示するPythonメソッド
機能が不要 - pandasには既に目的を達成するための実装があります!
import pandas as pd
df = pd.read_csv('test.csv')
counts = df['region'].value_counts()
least_common = counts[counts == counts.min()].index[0]
least_common_df = df.loc[df['region'] == least_common]
least_common_df
今ある:私が正しくあなたを理解していた場合はそうは以下のように、私は少なくとも共通領域を表すデータフレームを得るでしょう
department,sales,region
sales,26,midwest
finance,45,midwest
tech,69,west
finance,43,east
hr,20,east
sales,34,east
... test.csv
、私は以下のCSVファイルを持っていたと仮定:
department sales region
2 tech 69 west
最も一般的でない地域の部門の頻度を取得するために、私はあなたに任せます。 (私は既に地域のための周波数を得る方法を示しました)