私は行単位でマージする必要がある2つの大きなデータフレームを持っています。これらの2つのデータフレームは、いくつかの重なり合う行を有することができる。python/pandasでデータを重複させて横並びにマージするデータフレーム
例:行-DATA1場合は、[キー] ==行:
data1
key name patent
11 Alphagrep 112344
12 Citrix 112345
data2
Sr name patents
11 Alphagrep 112344
13 Taj 112322
私は[キー、Srの] & [特許、特許]で
にこれらのデータフレームの行が賢明をマージしたいです-data2 [Sr] & row-data1 [patent] == row-data2 [patents]、[Merge]、または[else]を追加します。
結果は次のようになります。
data1 + data2
key name patent
11 Alphagrep 112344
12 Citrix 112345
13 Taj 112322
どのようにしてパンダでこれを行う必要がありますか?
これは、この問題を回避するにはすてきなハックです。しかし、列が均等化できない(列の数が等しくない)状況があるとしたら、どのように動作しますか?私たちがパラメータを提供し、それらの列だけを確認する方法はありますか? – user248884
@ user248884、__reproducible__サンプルデータセットと望ましい結果のデータセットを投稿できますか?またはさらに良い - 新しい質問を開きます... – MaxU
ええ。特定のケースを作成し、新しい質問として投稿します。この解決策は既存の問題のために働くので、あなたはそれを受け入れるかもしれません:) – MYGz