私は製品の一覧とそれぞれのレビューのデータフレームを持っていますデータフレーム内のすべてのユニークワードを取得する方法は?
+ --------- + -------------------- ---------------------------- +
|製品|レビュー|
+ --------- + ------------------------------------- ----------- +
| product_a |カジュアルランチにはいいですね。
+ --------- + ------------------------------------- ----------- +
| product_b |エイヴリーは、最も知識のあるバリスタの一つです。
+ --------- + ------------------------------------- ----------- +
| product_c |ツアーガイドは秘密を教えてくれました|
+ --------- + ------------------------------------- ----------- +
データフレーム内のすべてのユニークワードを取得するにはどうすればよいですか?
私は機能作ら:
def count_words(text):
try:
text = text.lower()
words = text.split()
count_words = Counter(words)
except Exception, AttributeError:
count_words = {'':0}
return count_words
をそしてデータフレームに関数を適用するが、それは言葉だけが行ごとにカウント私に与えます。
reviews['words_count'] = reviews['review'].apply(count_words)
データフレームのサンプルを投稿できますか? –