Pythonでのざくろ関数

私は以下のデータセットを持っています。Pythonでのざくろ関数

https://docs.google.com/spreadsheets/d/13GCAXHp5BU4vYU6PdX40wM-Jhp--LeRd9C5oUurbVY4/edit#gid=0

私は1つの列の違い店の売上高の累積値を見つけたいです。例えば、店舗2106の累積値が販売図は、私は次の関数を使用してい176849

なければならない

DF = df.groupby（ 'storenumber'）[ '販売']。CUMSUM（）は私は正しい結果を得ていません

誰かが助けることができますか？

出典

2017-03-19 Omer Qureshi

ここで私はこの問題を解決するために何をしましたか？

import pandas as pd 
import numpy as np 

df = pd.read_csv('data.csv') # get data frame from csv file

あなたはそれがあるとしてdfでSale (Dollars)列が数値型としてフォーマットされていませんので、あなたのデータに数値演算を実行することはできません。次のコードは、Sale (Dollars)とSuggested answer列のデータをfloat型に変換し、ドル記号とカンマを区切ります。

df[df.columns[2:]] = df[df.columns[2:]].replace('[\$,]', '', regex=True).astype(float)

そして、私は、各ユニークStore Numberの累積値を取得するために、次のコードビットを使用します。 cum_sales_by_store_numberため

cum_sales_by_store_number = df.groupby('Store Number')['Sale (Dollars)'].agg(np.sum) 
cum_sales_by_store_number = pd.DataFrame(cum_sales_by_store_number)

出力：

   Sale (Dollars) 
Store Number 
2106    176849.97

私はこれがあなたの質問に答える願っています。ハッピーコーディング！

出典

2017-03-19 21:18:43

答えて

関連する問題