1
私は2つの同様のデータフレームを持っています。 df1とdf2は同じ構造である。また、1つの列(policyID)に同じデータがあり、他の列には異なるデータがあり、1つの列にはそれらを分離する必要があることに基づくタイムスタンプが含まれています。 DF1 -パンダのデータフレームの選択に複数の条件があります
policyID,statecode,county,timestamp
114455,FL,CLAY COUNTY,2016-12-34
df2-
policyID,statecode,county,timestamp
114455,FL,CLAY COUNTY,2015-12-23
私はDF2のタイムスタンプが高ければDF1のタイムスタンプが高く、DF2からのものである場合DF1からのデータが含まれているDF3を言う新しいデータフレームを作成する必要があります。
私は疑問を持って、drop_duplicateは、それがタイムスタンプを比較する方法を、重複を削除しますか? タイムスタンプに関係なく、最初のレコードを保存します –
ops、sorrry、私にasecを与えてください – jezrael
編集したデータをソートするためのsort_valuesを 'timestamp'でチェックしてください – jezrael