2016-11-16 9 views
0

jupyterノートブックを使用してkaggle https://www.kaggle.com/c/word2vec-nlp-tutorial/details/part-1-for-beginners-bag-of-wordsでこの問題を実践しています。nltk.downloadを使用しているとカーネルがビジーになる

私はストップワードを含む次のコード

輸入NLTK
nltk.download()#ダウンロードテキストデータセットを使用する場合、

カーネルがビジー状態になり、その後、私はいずれかを実行することができませんさらに細胞。

+0

あなたのシステムにpython-tkinterがインストールされていますか? 'nltk.download()'はダウンロードするパッケージを選択するtkinterウィンドウを開きます。それらがダウンロードされたら、ウィンドウを閉じて、次のセルに移動します。 jupyterとは対照的に、対話シェルで同じことを実行してみてください。 –

答えて

1

nltk.download()を実行すると、リソースをダウンロードするために使用できる対話型GUIウィンドウが起動します。しかし、非常に頻繁にこのウィンドウは、画面上の他のウィンドウの後ろに隠されています。それを探して、必要なものをダウンロードしてからダウンローダーウィンドウを閉じて、スクリプトがノートブックのカーネルに制御を戻せるようにします。

コードがダウンロードコマンドになったときにハングしないようにするには、代わりに非インタラクティブなダウンロードコマンドを使用できます。たとえば、茶色のコーパスの場合はnltk.download("brown")、nltkの本を読むときにはすべてのリソースを取得する場合はnltk.download("book")です。これらは、GUIウィンドウを開かずにダウンロードを実行します(既にリクエストされたリソースがある場合でも)。このためには、必要なリソースの内部名を知っているか、推測する必要があります。

関連する問題