0
私はgit hubでこの関数を見つけました。グループでパンダデータフレームに関数を適用する方法
def std_div(data, threshold=3):
std = data.std()
mean = data.mean()
isOutlier = []
for val in data:
if val/std > threshold:
isOutlier.append(True)
else:
isOutlier.append(False)
return isOutlier
私は、各グループのために私のデータフレームにこれを適用する
(DEPT)
employee_id dept Salary
1 sales 10000
2 sales 110000
3 sales 120000
4 hr 5000
5 hr 6000
これは動作しますが、それは全体のデータフレームのためのSTDのdivを計算します。
df["std_div"]= df.from_dict(std_div(df.Salary))
この関数は複数のアイテムを計算します。あなたはstdだけを望んでいますか? 'df.groupby(['dept'])['Salary']を試してみてください。agg( 'std')' – Parfait