2016-11-01 12 views
0

サプライヤがサプライヤの日付順からどのように逸脱しているかを示すために、パンダを使用してデータから有用なサマリを要約または可視化します。パンダを使用してデータを要約してプロットする

Supplier TimeDiff (days) 
A 3 days 
B 4 days 
B 12 days 
A 0 days 
C 1 days 
B 2 days 
D 3 days 
E 5 days 
E 7 days 

「サプライヤー」の欄は、サプライヤー・コードと「TimeDiff」欄(から「注文期日」「注文受信日」を差し引いた日付範囲)の時間差が含まれているが含まれています。ここに私のデータフレームの抜粋です。

このデータをどのように集計するのがよいかわかりますか?おかげ

+2

あなたはより具体的なことはできますか?このデータから何を学びたいですか?たとえば、次のように各サプライヤの平均「TimeDiff」を得ることができます: 'data.groupby( 'Supplier')。mean()['TimeDiff']' – burhan

答えて

2

私はサプライヤーにより平均TimeDiffを計算し始めるだろう:

import matplotlib.pyplot as plt 
import pandas as pd 

df = pd.DataFrame([['A', '3 days'], ['B', '4 days'], ['B', '12 days'], ['A', '0 days']], columns=['Supplier', 'TimeDiff']) 
df['TimeDiff'] = df['TimeDiff'].str.extract(r'(\d+)').astype(int) 
print df.groupby('Supplier').mean() 

      TimeDiff 
Supplier   
A    1.5 
B    8.0 

res.plot.bar() 
plt.show() 

enter image description here

+0

これらのソリューションをおねがいします。棒グラフを直接計算できるかどうか疑問に思う。 – user27976

+0

視覚化コードと画像を追加しました。 –

+0

ありがとうDennis。それは私のために働いた! – user27976

関連する問題