私はパンダのデータフレームを持っています。 1つの列があります。「col」 この列の各エントリは単語のリストです。 ['word1'、 'word2'など]すべてのパンダ細胞の相同化
nkltライブラリを使用して、これらすべての単語の補題を効率的に計算するにはどうすればよいですか?
import nklt
nltk.stem.WordNetLemmatizer().lemmatize('word')
私はパンダのデータセットの1列のすべてのセルのすべての単語のための補題を見つけることができるようにしたいです。
私のデータは、そのようになります。
import pandas as pd
data = [[['walked','am','stressed','Fruit']],[['going','gone','walking','riding','running']]]
df = pd.DataFrame(data,columns=['col'])
あなたのデータに基づいて 'apply'か' applymap'を使います。私たちが適切なものを提案できるようにいくつかのデータを表示してください。 – Dark