2017-06-30 5 views
0

NLTKブックライブラリからすべての書籍をインポートしましたが、コーパスを定義してから文章を印刷する方法を理解しようとしています。Python - 関数を実行する文章のコーパスを指定しますか?

私は、テキストの文2 4

import nltk 
from nltk.book import * 
print(???) 
print(???) 

、その後、テキスト3の文1を印刷したい場合たとえば、私は動作しません下記の組み合わせで、試してみた:

print(text3.sent1) 
print(text4.sent2) 

print(sent1.text3) 
print(sent2.text4) 

print(text3(sent1)) 
print(text4(sent2)) 

私はPythonの初心者ですから、それはおそらくv。基本的な質問ですが、私は解決策を他のところで見つけることができません。

多くのおかげで、事前に!

答えて

-1

文章を最初に文のリストに分割する必要があります。

すでにtext3text4をお持ちの場合:

from nltk.tokenize import sent_tokenize 

sents = sent_tokenize(text3) 
print(sents[0]) # the first sentence in the list is at position 0 

sents = sent_tokenize(text4) 
print(sents[1]) # the second sentence in the list is at position 1 

print(text3[0]) # prints the first word of text3 

あなたはNLTKチュートリアルやPythonのチュートリアルの両方を必要としているようです。幸いにも、the NLTK bookは両方です。

from nltk.tokenize import sent_tokenize 

# List of sentences 
sentences = "This is first sentence. This is second sentence. Let's try to tokenize the sentences. how are you? I am doing good" 

# define function 
def sentence_tokenizer(sentences): 

    sentence_tokenize_list = sent_tokenize(sentences) 

    print "tokenized sentences are = ", sentence_tokenize_list 
    return sentence_tokenize_list 

# call function 
tokenized_sentences = sentence_tokenizer(sentences) 
# print first sentence 
print tokenized_sentences[0] 

は、この情報がお役に立てば幸いです:として

+0

ありがとうございました!私は実際にNLTKの本を使って作業しています。これはPythonとNLTKを初めて使う人には便利です。 – LdnTky1985

+0

@ LdnTky1985、なぜこの回答を受け入れましたか?いくつかのチュートリアルを読むアドバイスは良いですが、コードが間違っていてエラーが発生します。 – alexis

0

簡単な例を与えることができます。

関連する問題