2017-07-11 14 views
2

私はstop_wordsパッケージをPythonで使用しています。ディレクトリパスusr/local/lib/python2.7/dist-packages/stop_words/stop-wordsのenglish.txtファイルのストップワードの元の数は174で、もう少し追加してリストは218になりました。english.txtファイルにストップワードを追加した後でも、ストップワードが更新されないのはなぜですか?

は私が

from stop_words import get_stop_words 

en_stop = get_stop_words('en') 

len(en_stop)はまだ174示しストップワードを取得するには、次のコマンドを使用します。変更を反映させる方法を教えてください。

+4

このようなシステムファイルは変更しないでください。アップグレード中に上書きされます。その代わりに、 'get_stop_words'を使って元のパッケージからストックリストを取得し、独自のパッケージを追加してください。 – Thomas

+0

@トーマス私は追加すべきストップワードをたくさん持っており、それらをストップワードとして永久に大文字にしたいと思っています。このリストには「though」や「though」のような非常に一般的な単語はありません。 – BlackSwan

答えて

1

ファイルにストップワードを追加しないでください。ストップワードを追加するには、追加する単語のリストを作成し、の機能を使用してsetを作成し、新しいリストを作成する必要があります。

en_stop = set(get_stop_words('en')) 
new_stop = {'newstopword'} 
en_stop = en_stop.union(new_stop) 
+1

ありがとう!助けになる。 – BlackSwan

-1

stop_wordsモジュールに単語を含めるには、まず、 'python -v'コマンドを使用して、これらのモジュールが配置されている場所を探します。 '/usr/local/lib/python2.7/site-packages/stop_words-2015.2.23.1-py2.7.egg/stop_words/stop-words'のような場所が表示されます。これらのディレクトリには英語を含む多くのファイルがあります.txtおよびother.jpgあなたはenglish.txtに入力したい単語をいくつか追加してから、モジュールをインポートします。 get_stop_wordsの長さが変更されました。

+1

ありがとうございます。私の質問の本文を読んでいれば、あなたが投稿したことを既に行っていることがわかります。 'stop_words-2015.2.23.1-py2.7.egg'のようなディレクトリはなく、' stop_words'と 'stop_words-2015.2.23.1-py2.7.egg-info'だけです。 – BlackSwan

+0

コマンドの出力は何ですか? - 'python -v'と入力してから 'stop_words import get_stop_words'を入力してください。 –

+0

ライブラリを直接修正するようユーザーに推奨する際は注意が必要です。 OPはしかし、モジュールをコピーして、自分自身を作ることができる、または彼のpythonコードで後でリストを拡張する –

関連する問題