2017-02-19 4 views
0

は上記のコードを実行した後、コードpythonでウェブサイトから抽出したpfdファイルを解読する方法は?ここで

#!/usr/bin/python 
import codecs 
import urllib.request 
resp = urllib.request.urlretrieve('http://normanpd.normanok.gov/filebrowser_download/657/2017-02-16%20Daily%20Incident%20Summary.pdf', 'test.pdf') 
with codecs.open("test.pdf") as f: 
    for line in f: 
     line.decode('utf-8') 

     print(line) 

で親切に、この問題が解決し得るために私を助けて

Traceback (most recent call last): 
    File "normanpd.py", line 6, in <module> 
    for line in f: 
    File "/usr/lib/python3.5/codecs.py", line 321, in decode 
    (result, consumed) = self._buffer_decode(data, self.errors, final) 
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 11: invalid start byte 

以下のように、私はエラーを取得しています。

答えて

0

ファイルがエンコードされた文字列だと思いますか?それは文字列ではありません。 pdfは読み込みできません。バイナリ形式です。あなたは反復して印刷するだけではありません。

関連する問題