共通の列の値を持つ2つのデータフレームからマージされたデータフレームを取得して、Pandasの一般的な列の値に基づいて2つのデータフレームをマージする
私は形式としてdf1
の5000行を持っている: - df2
movieId genres movie_title
1 Adventure|Animation|Children|Comedy|Fantasy Toy Story
2 Adventure|Children|Fantasy Jumanji
3 Comedy|Romance Grumpier Old Men
4 Comedy|Drama|Romance Waiting to Exhale
の
director_name actor_1_name actor_2_name actor_3_name movie_title
0 James Cameron CCH Pounder Joel David Moore Wes Studi Avatar
1 Gore Verbinski Johnny Depp Orlando Bloom Jack Davenport Pirates
of the Caribbean: At World's End
2 Sam Mendes Christoph Waltz Rory Kinnear Stephanie Sigman Spectre
と10000行の共通列 'MOVIE_TITLEは' 共通の価値観を持ち、それらをもとに、私が欲しいです'movie_title'が同じ行をすべて取得します。他の行は削除されます。
ご協力いただきありがとうございます。
注:私はすでに
pd.merge(dfinal, df1, on='movie_title')
を試してみましたが、出力は1行のように来て
director_name actor_1_name actor_2_name actor_3_name movie_title movieId title genres
と、私はすべてを試してみましたが、なかったのか= "外側"/"左"、 "右" の
多くの一般的なcoloumnは存在しますが、NaNを落とした後には行がありません。
それは が一列のみ \t director_name \t actor_1_name \t actor_2_name \t actor_3_name \t MOVIE_TITLE \t MOVIEID \tタイトル\tジャンル、あなたが唯一のマッチング 'movie_title'を持っていることを意味 –
@Harry_pb、のように来ては動作しません。マージは、文字列が__正確に同じである場合にのみ正しく動作します。 – MaxU