2016-10-12 39 views
0

Pandas Dataframeを使用して解決するには、ややユニークな問題があります。 DF2で、私は内のすべての行の加重価格を計算することが可能だということをDF1で今すぐ行ごとのPandas Dataframeカスタム期間のVWAP計算

df1 
time,     Date,   Stock, StartTime,  EndTime 
2016-10-11 12:00:00 2016-10-11 ABC  12:00:00.243 13:06:34.232 
2016-10-11 12:01:00 2016-10-11 ABC  12:02:00.243 13:04:34.232 
2016-10-11 12:03:00 2016-10-11 XYZ  08:02:00.243 11:24:23.533 

df2 
time,     Date,   Stock, Price, Volume 
2016-10-11 12:00:00 2016-10-11 ABC  10.0 100 
2016-10-11 12:01:00 2016-10-11 ABC  10.1 300 
... 
2016-10-11 16:01:00 2016-10-11 ABC  10.4 600 
2016-10-11 12:01:00 2016-10-11 XYZ  5.1 1500 
... 
2016-10-11 17:01:00 2016-10-11 XYZ  10.1 200 
... 

、私は日付や、株価欄にDF2し、それに参加したい:私は2つのデータフレームを、次のしていますdf1のStartTimeとEndTime。

ありがとうございました。

答えて

0

merge、groupby、および加重平均関数を適用します。

データをコードに移行して、人が簡単に読み込むことができます。

df1 = pd.DataFrame({'Date': {0: '2016-10-11', 1: '2016-10-11', 2: '2016-10-11'}, 'Stock': {0: 'ABC', 1: 'ABC', 2: 'XYZ'}, 'EndTime': {0: '13:06:34.232', 1: '13:04:34.232', 2: '11:24:23.533'}, 'StartTime': {0: '12:00:00.243', 1: '12:02:00.243', 2: '08:02:00.243'}, 'time': {0: '12:00:00', 1: '12:01:00', 2: '12:03:00'}}) 
df2 = pd.DataFrame({'Date': {0: '2016-10-11', 1: '2016-10-11', 2: '2016-10-11', 3: '2016-10-11', 4: '2016-10-11'}, 'Volume': {0: 100, 1: 300, 2: 600, 3: 1500, 4: 200}, 'Price': {0: 10.0, 1: 10.1, 2: 10.4, 3: 5.0999999999999996, 4: 10.1}, 'Stock': {0: 'ABC', 1: 'ABC', 2: 'ABC', 3: 'XYZ', 4: 'XYZ'}, 'time': {0: '12:00:00', 1: '12:01:00', 2: '16:01:00', 3: '12:01:00', 4: '17:01:00'}}) 

print df1 
print df2 

私は質問が少し不明瞭である、私に知らせて、必要に応じて答えは、質問と一致するように、我々はこの例を修正することができ、次のようにあなたのデータフレームであると仮定すると、冗長日は時間フィールドに持っています私は省略しています

  Date  EndTime  StartTime Stock  time 
0 2016-10-11 13:06:34.232 12:00:00.243 ABC 12:00:00 
1 2016-10-11 13:04:34.232 12:02:00.243 ABC 12:01:00 
2 2016-10-11 11:24:23.533 08:02:00.243 XYZ 12:03:00 

     Date Price Stock Volume  time 
0 2016-10-11 10.0 ABC  100 12:00:00 
1 2016-10-11 10.1 ABC  300 12:01:00 
2 2016-10-11 10.4 ABC  600 16:01:00 
3 2016-10-11 5.1 XYZ 1500 12:01:00 
4 2016-10-11 10.1 XYZ  200 17:01:00 



df_merged= df1.merge(df2, on=['Date','Stock']) # Merge 
df_merged = df_merged[['StartTime','EndTime','Price','Volume','Stock']] #Filter Columns 

Without Stock Partition: 
print df_merged.groupby(['StartTime','EndTime']).apply(lambda x: np.average(x['Price'],weights=x['Volume'])) 

With Stock Partition: 
print df_merged.groupby(['StartTime','EndTime','Stock']).apply(lambda x: np.average(x['Price'],weights=x['Volume'])) 

ができます:

StartTime  EndTime  
08:02:00.243 11:24:23.533  5.688235 
12:00:00.243 13:06:34.232 10.270000 
12:02:00.243 13:04:34.232 10.270000 
dtype: float64 


StartTime  EndTime  Stock 
08:02:00.243 11:24:23.533 XYZ  5.688235 
12:00:00.243 13:06:34.232 ABC  10.270000 
12:02:00.243 13:04:34.232 ABC  10.270000 
+0

は私が答えると、質問が編集されて参照してください。クール。 – Dickster

+0

ありがとう。これは便利です – Rahul

関連する問題