私はstop_words
パッケージをPythonで使用しています。ディレクトリパスusr/local/lib/python2.7/dist-packages/stop_words/stop-words
のenglish.txtファイルのストップワードの元の数は174
で、もう少し追加してリストは218
になりました。english.txtファイルにストップワードを追加した後でも、ストップワードが更新されないのはなぜですか?
は私が
from stop_words import get_stop_words
en_stop = get_stop_words('en')
len(en_stop)
はまだ174
示しストップワードを取得するには、次のコマンドを使用します。変更を反映させる方法を教えてください。
このようなシステムファイルは変更しないでください。アップグレード中に上書きされます。その代わりに、 'get_stop_words'を使って元のパッケージからストックリストを取得し、独自のパッケージを追加してください。 – Thomas
@トーマス私は追加すべきストップワードをたくさん持っており、それらをストップワードとして永久に大文字にしたいと思っています。このリストには「though」や「though」のような非常に一般的な単語はありません。 – BlackSwan