2017-08-27 12 views
0

に一覧表示するファイルから各行を読む私のコードです:は、ここではPython

with open(path) as file: 
    lines = file.readlines() 
    print lines[0:5] 

私は例えば、多くの余分な文字を取得するしかし:

['cat2\xc2\xa0\xc2\xa0 2\xc2\xa0 0', 'cat1\xc2\xa00.5\xc2\xa0 0', 'cat2\xc2\xa0\xc2\xa0 1\xc2\xa0 0', 'cat1\xc2\xa0\xc2\xa0 0\xc2\xa0 0', 'cat2\xc2\xa0\xc2\xa0 0\xc2\xa0 3'] 

は、なぜ私はそれらを得るのですか?

cat2   2  0 
cat1 0.5  0 
cat2   1  0 
cat1   0  0 
cat2   0  3 
+0

あなたのファイルに奇妙な文字を持っているように見えます... –

+0

の詳細を参照してください。 –

答えて

2

\xc2\xa0non-breaking space次のとおりです。

オリジナルのテキストファイルは、このでした。ファイル内の通常のスペースで置き換えます。

このシーケンスは、UTF-8を含む多くのエンコードで表示されます。これはリンク重複している解決するための全成分:

はこれを再度開くしようとしている誰のためにWikipedia

+0

これらの文字をどの形式で追加してください。 – Prajwal