Name
列でデータをソートしようとしています。パンダは、データセットに列の値が何回表示されるかを確認します。
は今のところ、私はこれをやっている:
df['Count'] = df.apply(lambda x: len(df[df['Name'] == x['Name']]), axis=1)
df[df['Count'] > 50][['Name', 'Description', 'Count']].drop_duplicates('Name').sort_values('Count', ascending=False).head(100)
しかし、このクエリは非常に遅いですが、それは実行に時間がかかります。
これを行うにはもっと効率的な方法はありますか?
DataFrameのサンプルを提供してください! – Alex
http://stackoverflow.com/questions/22391433/count-the-frequency-that-a-value-occurs-in-a-dataframe-column – Lynob
@Lynobは魅力的に働いていました。 –