0
私は2つのデータフレームを持っています。最初のファイルには多くのデータがあり、2番目のファイルにはiD
のリストがあります。最初のファイル。パンダを使用して異なるdfのデータをマージする方法
私は
merged = pd.merge(buys, chunk, left_on='id', right_on='ID')
どこchunk
使用 - 最初の(大きな)ファイルの一部を。そしてbuys
- リストがid
のファイル。出力ファイルにはID
があり、それはbuys
にはありません。 私は間違っていますか?
buys
:
id
7602962fb83ac2e2a0cb44158ca88464
bc8a731e4c7e6f6b96e56ebe7f766bcd
a703114aa8a03495c3e042647212fa63
77138e9245857e5449e9474293e31e19
chunk
:
id date
7602962fb83ac2e2a0cb44158ca88464 01.01.2016
7602962fb83ac2e2a0cb44158ca88464 02.01.2016
7602962fb83ac2e2a0cb44158ca88464 03.01.2016
77138e9245857e5449e9474293e31e19 09.05.2016
77138e9245857e5449e9474293e31e19 10.05.2016
671cfd6702c74f017209c2f1a888c279 10.01.2016
671cfd6702c74f017209c2f1a888c279 11.01.2016
029cfd6702c68f243423c2f1a234c232 11.03.2016
そして、私はあなたの2つのデータフレームをマージしたいとちょうどbuys
でid
存在を維持
7602962fb83ac2e2a0cb44158ca88464 01.01.2016
7602962fb83ac2e2a0cb44158ca88464 02.01.2016
7602962fb83ac2e2a0cb44158ca88464 03.01.2016
77138e9245857e5449e9474293e31e19 09.05.2016
77138e9245857e5449e9474293e31e19 10.05.2016
サンプルデータと出力を投稿できますか? –
@JoeR、dataframesを追加する – ldevyataykina
'how = left'を' pd.merge'に追加します。 – ytk