2017-11-17 10 views
1

私は2つのcsvファイルが持っている:私は時系列データとパンダのメタデータを組み合わせる適切な方法は何ですか?

df_customers = pd.read_csv('customers.csv') 
df_purchases = pd.read_csv('purchases.csv') 

が、どのように私はそれらの組み合わせることができ、両方のデータフレームを読み込むことができ

purchase_id customer_id item       price 
1    1    About the ugly German language 3.14 
2    1    Food       15.92 
3    1    Book       65.35 
4    2    Stone       89.79 

customer.csv

id name  birthday 
1 Martin 28.04.1990 
2 Twain 30.11.1835 
.... 

purchases.csvを2つ、私は簡単に以下の質問をしてください:

  • 各顧客は何個購入しましたか?
  • 各顧客の商品の平均価格はいくらですか? right

答えて

2

使用merge参加:

df = pd.merge(df_customers, df_purchases, left_on='id', right_on='customer_id', how='right') 
print (df) 
    purchase_id customer_id       item price 
0   1   1 About the ugly German language 3.14 
1   2   1       Food 15.92 
2   3   1       Book 65.35 
3   4   2       Stone 89.79 
    id name birthday purchase_id customer_id \ 
0 1 Martin 28.04.1990   1   1 
1 1 Martin 28.04.1990   2   1 
2 1 Martin 28.04.1990   3   1 
3 2 Twain 30.11.1835   4   2 

          item price 
0 About the ugly German language 3.14 
1       Food 15.92 
2       Book 65.35 
3       Stone 89.79 
関連する問題