2016-03-26 5 views
2

は、私が「NLTKとPythonのテキスト処理」この本を読んでいる、と本に結果がある:結果(Python)の "u"とは何ですか?

>>> stopwords.fileids() 
['danish', 'dutch', 'english', 'finnish', 'french', 'german', 'hungarian', 'italian', 'norwegian', 'portuguese', 'russian', 'spanish', 'swedish', 'turkish'] 

しかし、私は、端末でコードを実行すると、結果は以下のとおりです。

>>> stopwords.fileids() 
[u'danish', u'dutch', u'english', u'finnish', u'french', u'german', u'hungarian', u'italian', u'norwegian', u'portuguese', u'russian', u'spanish', u'swedish', u'turkish'] 

すべての文字列の前にある "u"とは何ですか?

+0

[文字列値の前に「u」記号が表示されていますか?](http://stackoverflow.com/questions/11279331/what-does-the-u-symbol-mean-in-front文字列の値) – koukouviou

+0

2つの文字列を比較すると、接頭辞 'u'とそれ以外の文字列を使用していない文字列を比較しても、True(完全一致)が返されるため、心配する必要はほとんどありません。 – akash12300

+2

現在、Python 2を使用しています。優れたテキスト操作機能を備えているため、自然言語処理のためにPython 3に切り替えることをお勧めします。この 'u'接頭辞もそこにあります。 NLTKバージョン3.0はPython 3をサポートしています。 –

答えて

4

ユニコードあなたのPythonインタプリタでこれを入力して、あなた自身のためにチェックすることができ

含む文字列のためのuスタンド:Unicode文字列python2

s = unicode('abcdef') 
type(s) # <type 'unicode'> 
t = u'unicode' 
type(t) #<type 'unicode'> 

詳しい情報は| python3

関連する問題