2017-03-19 2 views
0

私は以下のデータセットを持っています。Pythonでのざくろ関数

https://docs.google.com/spreadsheets/d/13GCAXHp5BU4vYU6PdX40wM-Jhp--LeRd9C5oUurbVY4/edit#gid=0

私は1つの列の違い店の売上高の累積値を見つけたいです。例えば、店舗2106の累積値が販売図は、私は次の関数を使用してい176849

なければならない

DF = df.groupby( 'storenumber')[ '販売']。CUMSUM()は私は正しい結果を得ていません

誰かが助けることができますか?

答えて

0

ここで私はこの問題を解決するために何をしましたか?

import pandas as pd 
import numpy as np 

df = pd.read_csv('data.csv') # get data frame from csv file 

あなたはそれがあるとしてdfSale (Dollars)列が数値型としてフォーマットされていませんので、あなたのデータに数値演算を実行することはできません。次のコードは、Sale (Dollars)Suggested answer列のデータをfloat型に変換し、ドル記号とカンマを区切ります。

df[df.columns[2:]] = df[df.columns[2:]].replace('[\$,]', '', regex=True).astype(float) 

そして、私は、各ユニークStore Numberの累積値を取得するために、次のコードビットを使用します。 cum_sales_by_store_numberため

cum_sales_by_store_number = df.groupby('Store Number')['Sale (Dollars)'].agg(np.sum) 
cum_sales_by_store_number = pd.DataFrame(cum_sales_by_store_number) 

出力:

   Sale (Dollars) 
Store Number 
2106    176849.97 

私はこれがあなたの質問に答える願っています。ハッピーコーディング!

関連する問題