私はNLTKに新しいですし、私は予想以上に異なる出力を与えている二つの文字列に機能sent_tokenize
を使用し動作していないsent_tokenizeが正しく
1)まず、文字列
sent_tokenize("An uncle is the female sibbling of one's parents. An aunt can also be the wife of an [[uncle]] who is the male sibbling of a parent")
出力:
["叔父は両親の女性の兄弟です" '叔母は男性の兄弟である[[叔父]]の妻でもあります親」のNG]
2)第刺さ
sent_tokenize("An uncle is the female [[sibbling]] of one's [[parent]]s. An aunt can also be the wife of an [[uncle]] who is the male sibbling of a parent")
出力:
[ "叔父が女性[[sibbling]である]自分の[[親の]] s。叔母は、親「第二ので、ここで
それが問題になる可能性がありますどのような最初のように2つの文を与えていないの男性sibblingある[[叔父]]の妻になることができますか?
(私たちのように分割し、区切り文字を使用することができます「」と文章を得るが、ここでの問題が何であるかを知りたい)