リストするPythonの.txtコンテンツ

.txtファイルを開き、単語をリスト内の別々の文字列に分けたいとします（例：[this、 'is'、 'an'、 'example']）。何かの理由でこれを試みると、文字が区切られ、私の元のテキスト文書になかった奇妙な記号や文字が最初に表示されます。リストするPythonの.txtコンテンツ

file = open(userFile, "r") 
userInput = file.read() 
file.close() 
print(userInput)

私の.txtファイルのみを繰り返し言葉 '他の何か' 時代のカップルを含んでいました。

2017-05-04 Zafi Shah

このファイルは、UTF-16として保存されたように見えます。どのエディタを使用しても、UTF-8またはプレーンなASCIIテキストを使用するように設定することができます。 – jasonharper

with open("input.txt", "r") as infile: 
    lines = infile.readlines() 
infile.close() 
words = [word.strip() for word in lines]

これは、さまざまなファイルエンコードで機能します。

2017-05-04 21:53:32 quantik

ASCIIも動作するはずです。 –

@ArtemisFowlこれは1年前の私の知識であった – quantik

答えて