csv(下のサンプル)は、ある週(week_end_date)のアイテムの絶対エラーを示しています。 CSVが示すように、アイテムは部門に属し、部門が複数の項目があります。ここではグループに基づいて新しいパンダデータフレームを作成する
mdse_dept_ref_i week_end_date average_ABSError num_items_in_department
を私は何をしたい、次のフィールドを持つ新しいデータフレームを作成することです私が行うことができる午前です:最終的に私が見たいと思っているので、私は、単一のデータフレームを作成するために、すべての部門のためにこれを自動的に行う方法がわからない、
new_df = df.loc[df['mdse_dept_ref_i'] == 47]
num_items = new_df.groupby('week_end_date').size()
avg_abs_error = new_df.groupby(['week_end_date'])['ABSError'].mean()
new_df = num_items.to_frame().join(avg_abs_error.to_frame())
をしかし、どのようにあるアイテムの数部門はavに影響を与えているまた、最悪の結果を出す部門を見ることができます。また、groupby('week_end_date')
を実行すると、week_end_date
がインデックスになりますが、私はそれを新しいデータフレームのフィールドにしたいので、プロット中に使うことができます。誰か助けてくれますか?
"いくつかのプロットは、" 正確には、何を意味するのでしょうか? –
あなたの質問はあまり明確ではありません。あなたは、あなたが望むデータフォーマットに関するいくつかの例を挙げることができますか? – Jacobm001
@MadPhysicist:更新された質問 – user1274878