NLTKを使用してリスト要素からストップワードを削除しています。ここ は私のコードスニペットは、問題はこれがストップワードを削除するだけでなく、それは例えば、他の言葉から文字を削除して、あるPythonでNLTKを使用してストップワードを削除する
dict1 = {}
for ctr,row in enumerate(cur.fetchall()):
list1 = [row[0],row[1],row[2],row[3],row[4]]
dict1[row[0]] = list1
print ctr+1,"\n",dict1[row[0]][2]
list2 = [w for w in dict1[row[0]][3] if not w in stopwords.words('english')]
print list2
です単語 'orientation'から 'i'を除いて、より多くのストップワードが削除され、さらにlist2に単語の代わりに文字が格納されます。 つまり['O'、 'r'、 'e'、 'n'、 'n'、 ''、 'f'、 ''、 '3'、 ''、 'r'、 'e'、 'r 'n'、 '\ n'、 '\ n'、 'O'、 'r'、 'e'、 'n'、 'n' 「r」「e」「r」「e」「r」「p」「l」は、 ...................... 私は['オリエンテーション'、 '.............. ......
あなたの言葉を最初にトークンにしてみてください – galaxyan
あなたのコードにcurとは何ですか?もっとコンテキストコードを投稿してください。 –