私は特定の期間のクエリとカウントを含むpandasデータフレームを持っています。このデータフレームをユニークワード数に変換したいと考えています。たとえば、データフレームに以下が含まれている場合:パンダの文字列の中の単語を数えます
query count
foo bar 10
super 8
foo 4
super foo bar 2
私は以下のデータフレームを受け取っています。例えば単語「foo」は表の中で正確に16回現れます。
word count
foo 16
bar 12
super 10
私は、以下の機能が働いているが、それはほとんどこれを行うための最適な方法のように思えることはありません、また、各行の合計数を無視します。
def _words(df):
return Counter(re.findall(r'\w+', ' '.join(df['query'])))
ご協力いただきますようお願い申し上げます。
ありがとうございます!
'オプション1 'は純粋な美しさです! – MaxU
メモを作る:) – Vaishali
うわー、すべての詳細な回答ありがとう!オプション1は素晴らしいです。多くのありがとう – Seano314