私はLinux Mint 18.1とPython 3.5.2を使用しています。Python 3でtarファイルを開くときのUnicodeDecodeError
現在Python 2.7を使用しているライブラリがあります。私はPython 3プロジェクトのためにライブラリを使用する必要があります。私はそれを更新しており、修正できないようなユニコード問題にぶつかっています。
最初に、ファイルはtar cvjf tarfile.tbz2
(Linuxシステム上)で作成され、後でPythonライブラリでopen(tarfile)
として開きます。
私は、Python 3を使用して、そのままのコードを実行した場合、私は次のエラーを取得する:修正で
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc1 in position 11: invalid start byte
私の最初の試みは、私はtarはだろうという印象の下にあったとしてopen(tarfile, encoding='utf-8')
としてそれを開くようにしましたファイルシステムが与えたものだけを使用してください。これを行うと、同じエラー(バイト値が変わる)が発生します。
私は別のエンコーディングでしようとすると、latin-1
言って、私は次のエラーを取得する:
TypeError: Unicode-objects must be encoded before hashing
utf-8
が正しいですが、私は誤解されるかもしれないと信じているように私につながります。
誰でも提案を提供できますか?