0
import nltk
import nltk.data
nltk.corpus.brown
y= nltk.corpus.brown.raw()
print(y)
私はprint(y)
を行うと、それは、私にこのコーパス内の生データの全てを示し が、私は、この生コーパスからのみ10,000
単語を取得したいです。 これをどうすれば実現できますか?生のコーパスから特定の遠隔単語を取得するには?
私は言葉から10000個の言葉を必要といけません。私は生のコーパスから言葉が必要です。 words = nltk.corpus.brown.raw()の代わりにwords = nltk.corpus.brown.words()を書きました –
'words()'には、 'raw()'にある全ての単語が同じ順序で。 'nltk.corpus.brown.raw()[0:100]'と 'nltk.corpus.brown.words()[0:10]' – Till
ありがとうございました。 nltk.corpus.brown.words()[0:10] これは私が実際に欲しかったことです。 –