私はいくつかの列でグループ化する必要があります私はhavパンダのデータフレーム。グループ内のほとんどのグループは1行しか持たないが、少数のグループは複数の行を持つ。これらのそれぞれについて、私は最初の日付で行を保持したいだけです。 私はagg
とfilter
の両方の機能を試しましたが、私の必要としているようには見えません。パンダグループビービー1つの行を選択
def first(df):
if len(df) > 1:
return df.ix[df['date'].idxmin()]
else:
return df
df.groupby(['id', 'period', 'type').agg(first)
'df.sort_values( '日付')。GROUPBY([ 'ID'、 '区間'、 'タイプ' 検討します]))first() '? – MaxU