最近私はETL開発者として仕事を始めました。私の練習の一環として、生データを含むテキストファイルからデータを抽出しています。私の生データは画像のように見えます。 My Raw DataPythonを使用してテキストファイルに区切り文字を追加する
ここでデータファイルに区切り記号を追加します。基本的にはすべての行の後にコンマ(,
)を追加したいと思います。 Pythonの私のコードはこのように見えます。 new_locations.txt
は出力テキストファイルである
with open ('new_locations.txt', 'w') as output:
with open('locations.txt', 'r') as input:
for line in input:
new_line = line+','
output.write(new_line)
、locations.txt
は、生データです。
しかし、私はいつもエラーを投げます。
UnicodeDecodeError: 'charmap' codec can't decode byte 0x81 in position 3724: character maps to
どこが間違っていますか。
Note: The characters in raw data are not all ASCII characters. Some are Latin characters as well.
これらのエラーを起こさずにファイル全体を読むことができますか? –
@DanielLeeいいえファイル全体を読み取ることができません。私はASCII文字が存在するまでしか読むことができません。他の文字が始まると、エラーが発生します。 –