だから、テキストファイルからすべてのストップワードを削除しようとしている。問題は、単語ごとにストップワードを削除することです。私の関数remove_stopwords。単語のすべてのストップワードを削除する
def remove_stopwords(input):
stop_words = set(stopwords.words('english'))
filtered_words = [word for word in input if not word in stop_words]
return filtered_words
Sample Input: Damage from Typhoon Lando soars to P6B
Output: Dge fr Tphn Ln r P6B
もし 'input'が文字列であれば、それを単語に分割する必要があります。たとえば、' '単語がstop_wordsにないならinput.split()内の単語 ''、次にdoあなたが結果のリストで何をしたいのですか...そうでなければ、各文字を繰り返して、その文字がストップワード内に存在する場所を取り除いています。 –
@JonClementsありがとうございました! –