私たちは、txtファイルに埋め込まれたuuencodeされたPDFファイルの一部をデコードしようとしています。特定のUUencodeされたファイルがPythonを使って正しくデコードされないのはなぜですか?
問題は、ほとんどのPDFファイルがPythonのuuencodeライブラリを使ってうまくデコードされていることです。
try:
decoded_file,m=uudecode(fileString)
except:
decoded_file=''
ただし、一部のファイルはデコード後に開くことができません。 「この文書を開く際にエラーが発生しました。ファイルが破損して修復できませんでした」というメッセージが表示されます。
私たちがGoogleで見つけられる唯一のものは、私たちのファイルがbase64でエンコードされている可能性があり、Pythonのuuencodingモジュールがbase32のみをサポートしているということです。 base64またはbase32を使用してuuencodeされているかどうかを判断できる方法はありますか?ここで
は、我々が正常に復号化uuencodeされたPDFファイルを持っていたtxtファイルの例です: http://www.sec.gov/Archives/edgar/data/914257/000000000011005978/0000000000-11-005978.txt
を私たちはこれらをデコードしている間: http://www.sec.gov/Archives/edgar/data/1108046/000000000011020832/0000000000-11-020832.txt
そしてここでは、失敗した1例ですPythonでは何のエラーも表示されず、すべてが正常に動作しているようです。何が原因でデコードが正しく行われないのでしょうか?私たちがそれらを処理している間、これをフラグする方法はありますか?
'except:'は* bad *です。あなたは、Pythonが生成する診断に目立たないようにしています。 – pyroscope