downloader.pyでDEFAULT_URLを更新しましたが、次のエラーが表示されます。私はもともとnltk.downloader()とファイルブラウザを更新しようとしましたが、ダウンロードしようとするとgithubサイトに戻りました。Python 3.5:NLTKダウンロードの既定のURLは変更されません
DEFAULT_URL = 'http://nltk.org/nltk_data/'
。
import nltk
nltk.set_proxy('proxyaddress',user=None)
dl = nltk.downloader.Downloader("http://nltk.org/nltk_data/")
dl.download('all')
[nltk_data] Downloading collection 'all'
[nltk_data] |
[nltk_data] | Downloading package abc to C:\nltk_data...
[nltk_data] | Error downloading 'abc' from
[nltk_data] | <https://raw.githubusercontent.com/nltk/nltk_data
[nltk_data] | /gh-pages/packages/corpora/abc.zip>: <urlopen
[nltk_data] | error [Errno 11004] getaddrinfo failed>
これはまだraw.githubusercontent.com/nltk/nltk_dataにデフォルト設定されていますか?
「DEFAULT_URL」を再定義する必要はありません。それはあなたがそうするのと同じようにあなた自身のURLでDownloaderを初期化するときに無視されます。とにかく私はあなたの問題を再現することはできません:それは私のために期待どおりに動作します。プロキシが問題を引き起こしている可能性がありますか? – alexis
@alexisそれは私のプロキシです。私は私のオフィスを去ったときにもう一度やってみました。私は他の多くの状況で同じプロキシを使用していますので、今は "set_proxy"関数がうまく動作しないのが不思議です。 – njfrazie
'set_proxy'はURL処理を変更する' urllib.request.build_opener'と 'install_opener'を呼び出します。問題はあなたのプロキシから来なければなりません。 – alexis