生のコーパスから特定の遠隔単語を取得するには？

import nltk 
import nltk.data  

nltk.corpus.brown  
y= nltk.corpus.brown.raw() 
print(y)

私はprint(y)を行うと、それは、私にこのコーパス内の生データの全てを示しが、私は、この生コーパスからのみ10,000単語を取得したいです。これをどうすれば実現できますか？生のコーパスから特定の遠隔単語を取得するには？

あなたが行うことができます：

import random 
words = nltk.corpus.brown.words() 
random_words = random.sample(words, 10000)

2016-03-26 16:45:03 Till

私は言葉から10000個の言葉を必要といけません。私は生のコーパスから言葉が必要です。 words = nltk.corpus.brown.raw（）の代わりにwords = nltk.corpus.brown.words（）を書きました –

'words（）'には、 'raw（）'にある全ての単語が同じ順序で。 'nltk.corpus.brown.raw（）[0：100]'と 'nltk.corpus.brown.words（）[0:10]' – Till

ありがとうございました。 nltk.corpus.brown.words（）[0:10] これは私が実際に欲しかったことです。 –

答えて