内のすべての値の列と行(2の2セット)、私はサイズの異なる2つのデータフレームを持っていると私は、4つの異なる列のすべての値の比較を使用したいデータフレーム
を比較すると、基本的に私が見たいのですがここで、df1 ['A'] == df2 ['A'] &ここで、df1 ['B'] == df2 ['B']を返し、df1 ['C']の値にdf2 ['C'] ' sは
import pandas as pd
df1 = pd.DataFrame({"A": [1, 2, 3, 4, 3], "B": [2, 5, 4, 7, 5], "C": [1, 2, 8, 0, 0]})
df2 = pd.DataFrame({"A": [1, 3, 2, 4, 8], "B": [5, 5, 4, 9, 1], "C": [1, 3, 3, 4, 6]})
df1:
A B C
0 1 2 1
1 2 5 2
2 3 4 8
3 4 7 0
4 3 5 0
...
df2:
A B C
0 1 5 1
1 3 4 3
2 2 5 4
3 4 9 4
5 8 1 6
...
in: df1['A'] == df2['A'] & where df1['B'] == df2['B']
df1['D'] = df1['C'] + df2['C']
out: df1:
A B C D
0 1 2 1 nan
1 2 5 2 6
2 3 4 8 11
3 4 7 0 nan
4 3 5 0 nan
値私の実際のデータフレームは、はるかに大きい(「A」列の両方の値を持つデータの120000ish行は1から700の範囲であり、1から300まで「B」)ので、私はそれがより長いかもしれない知っていますプロセス。
Iはまた、両方の列の数字 'A「の繰り返し数回、複数の列および行番号があるgrided平面から2つのデータセットと同じように考えることを言及することを意味します各セルに専用で、2つのセルが等しい(2つの行が等しく、2つの列が等しい)数学を行う必要があります。この場合、私はそれらをAとBの名前にしますが、混乱を避けるためです私はそれほどうまくやっていないと確信しています。 – rosskush