コード化を推測する助けとして、Python用にchardetライブラリを使用します。
>>> import chardet
>>> s='002òÅü¢âyâbâeâBâôâO(âuâïâ}).mp4'
>>> chardet.detect(s.encode('l1'))
{'encoding': 'ISO-8859-5', 'confidence': 0.536359806931924, 'language': 'Russian'}
>>> chardet.detect(s.encode('cp437'))
{'encoding': 'SHIFT_JIS', 'confidence': 0.99, 'language': 'Japanese'}
>>> chardet.detect(s.encode('cp850'))
{'encoding': 'SHIFT_JIS', 'confidence': 0.99, 'language': 'Japanese'}
おそらくISO-8859-1、より多くの可能性がないIBM 437または850
>>> s.encode('cp850').decode('sjis')
'002撫⊃ペッティング(ブルマ).mp4'
>>> s.encode('cp437').decode('sjis')
'002撫○ペッティング(ブルマ).mp4'
は、これらのいずれかだろうが、私はそれらを読むことができません。
私はかつてPythonを使ったことがありません。私はインポートチャードをしました、変数の割り当てを行いました。 "UnicodeDecodeError: 'ascii'コーデックは3桁目の0xc3バイトをデコードできません:序数は範囲外です(128)"何が間違っていましたか? – Kayot
Python 3に切り替えてください。 –
ああ、私はコンソールでpythonを使用していました。それはpython3です。ありがとう、今これを関数形式にして、私はそれらの名前を変更するためにそれらのファイルを実行することができますプログラムを作る。情報のおかげで。 – Kayot