を持っている私は、データフレームのように持っている:パイソン/パンダ - get_group部分文字列
name . profession
Alex . Data Analyst
Markus . Sales Manager
Carlos . Credit Analyst
Otavio . HR Manager
...
私はその職業に文字列「アナリスト」を持っているどのように多くの人々、このデータフレームで知っておく必要があります。答えは2でなければなりません。
groupby
とget_group
を使用しようとしていますが、get_group
の構文に正しい方法を見つけることができません。
今私がここにいる:
df.groupby('profession').get_group(???).agg('count')
誰かが右の構文であるか、またはそれを行うための別の方法を提案するだろうか助言することはできますか?
一般的に、部分文字列のget_groupは使用できません。あなたができることはトライや何かで得ることです。ほとんどの場合、.str.containsは速くなりますが(それは問題であるかもしれないO(n)ですが)多くの「針」を再計算するとgroupbyのキーを索引付けする価値がある(例えば、トライで)。 –