2017-05-04 6 views
0

.txtファイルを開き、単語をリスト内の別々の文字列に分けたいとします(例:[this、 'is'、 'an'、 'example'])。 何かの理由でこれを試みると、文字が区切られ、私の元のテキスト文書になかった奇妙な記号や文字が最初に表示されます。リストするPythonの.txtコンテンツ

file = open(userFile, "r") 
userInput = file.read() 
file.close() 
print(userInput) 

Screen shot of what I get when I run my code.

私の.txtファイルのみを繰り返し言葉 '他の何か' 時代のカップルを含んでいました。

+0

このファイルは、UTF-16として保存されたように見えます。どのエディタを使用しても、UTF-8またはプレーンなASCIIテキストを使用するように設定することができます。 – jasonharper

答えて

1
with open("input.txt", "r") as infile: 
    lines = infile.readlines() 
infile.close() 
words = [word.strip() for word in lines] 

これは、さまざまなファイルエンコードで機能します。

+0

ASCIIも動作するはずです。 –

+0

@ArtemisFowlこれは1年前の私の知識であった – quantik

関連する問題