私は、多くの場合、次の形式でいくつかのパンダのデータフレームで自分自身を見つける:「pandas.merge」を除いて、特定の列の複数のパンダデータフレームをどのようにマージできますか?
import pandas as pd
df1 = pd.read_table('filename1.dat')
df2 = pd.read_table('filename2.dat')
df3 = pd.read_table('filename3.dat')
print(df1)
columnA first_values
name1 342
name2 822
name3 121
name4 3434
print(df2)
columnA second_values
name1 8
name2 1
name3 1
name4 2
print(df3)
columnA third_values
name1 910
name2 301
name3 132
name4 299
私は
columnA first_values second_values third_values
name1 342 8 910
name2 822 1 301
name3 121 1 132
name4 3434 2 299
を与え、「columnA」で一緒にこれらのデータフレームのそれぞれを統合したいと思い、私は通常、これに頼りますハック:その後、
merged1 = df1.merge(df2, on='columnA')
merged2 = df3.merge(merged1, on='columnA')
しかし、これは多くのデータフレームではスケーリングされません。これを行う正しい方法は何ですか?
'pandas.concat'? – BrenBarn
@BrenBarnしかし、何の連鎖?索引を連結することはできますか? – ShanZhengYang
これは何か? 'dfsのdfのためのdf.set_index( 'columnA')、軸= 1).reset_index()' – ayhan