パンダで複数のデータフレーム(つまり2つ以上)をマージする最も効率的な方法は何ですか?いくつかの答えがあります。パンダで複数のデータフレームを効率的にマージ
- pandas joining multiple dataframes on columns
- Pandas left outer join multiple dataframes on multiple columns
が、これらはすべて、複数の結合伴います。私がN個のデータフレームを持っていれば、N-1個の結合が必要になります。
私がパンダを使用していなかった場合、別の解決策は、共通インデックスをキーにしたハッシュテーブルにすべてを入れて最終バージョンを構築することです。これは基本的にはSQLのハッシュ結合のようなものです。パンダのようなものがありますか?
もしそうでなければ、共通のインデックスを持つ新しいデータフレームを作成し、各データフレームから生データを渡すほうが効率的でしょうか? N-1結合のそれぞれで新しいデータフレームを作成できないように思えます。
ありがとうございました。
どのようにそれらを結合するつもりですか?インデックスに?内部結合または左/外部結合? – MaxU