2016-03-22 6 views
0

私はプログラムを実行すると 文章がword2vec.Text8Corpus(「/ tmpに/ text8」) しかし私が手=行が含まれてgensim http://rare-technologies.com/deep-learning-with-word2vec-and-gensim/のチュートリアルを実装していますものですtext8は存在しないというエラーです。コードを見ると、Text8Corpusは引数型オブジェクトを受け入れるメソッドであることがわかります。命令は、私がこのファイルを手動でダウンロードして、私は許可が拒否されたことを聞いていたimbd非圧縮データセットを渡ししようとすると、それは(「/ tmpに/ text8」)gensim

http://mattmahoney.net/dc/text8.zip

を渡す必要があることを示しています。誰もがこの問題の洞察を持っていますか?私は自分自身でimdbデータセットをダウンロードしたと思いますか、それとも自動的にコード内にポインタがあると思いますか?

+0

を、あなたは他のウィンドウ/ Linuxの/ OSX /にありますか?あなたが '/ tmp /'フォルダ内のtext8.zipを解凍する必要があるように私に見える – Noelkd

答えて

3

彼の説明で言うように、ファイルをダウンロードして/ tmpディレクトリに解凍する必要があります。あなたはこのようにこれを行うことができます:

wget http://mattmahoney.net/dc/text8.zip -P /tmp 
unzip text8.zip 

今、あなたはOKである必要があります。)

+0

事は、私はファイルをダウンロードしてアップアップしましたが、許可の問題があります。 Windows上で動作しないように見えるwget – Steve

+0

あなたはLinux上にいると思っていましたが、Windowsの検索で%tmp%をタップしてファイルをそこにコピーすることができます。権限の問題がある場合は、ファイルを別のディレクトリに変更してコードを更新してください。 – arcticless

+0

助けてくれてありがとう – Steve