2017-04-06 8 views
1

Python 2.7を使用してHTMLページに埋め込まれたPDFファイルを取得しようとしています。私はurllibとBeautifulSoupを使ってみましたが、成功しませんでした。私の問題は、ページのソースコードを表示するときにPDFリンクが見つからないことです。その場で生成され、HTMLページに埋め込まれたPDFファイルを取得します。

ダウンロードしようとしているPDFの例を次に示します。link

このファイルをPythonを使用してコンピュータにダウンロードするにはどうすればよいですか?

編集:PDFがおそらくその場で生成されることに気付きました。このタイプのファイルを自動的にダウンロードすることは可能ですか?

+0

私は同じことをやってきました。あなたは解決策を見つけましたか? – haltman

+0

@haltmanいいえ、もう少し試してみましたが、何も効果がありませんでした。私は諦めましたが、もしあなたがそれを見つけたら、私はまだ解決策に興味があります! – Deuce

+1

私は自分の解決策を得ましたが、それは少しうまくいきましたが、うまく働いています。セレンライブラリを使って自動的にWebページを開き、pyautoguiを使ってファイルを保存してダイアログウィンドウとやりとりして、動作例が必要かどうかを教えてください – haltman

答えて

0

チャオ、私の作業溶液のthats

from bs4 import BeautifulSoup 
from selenium import webdriver 
import time 
import pyautogui 

browser = webdriver.Firefox() 
browser.get('your-link') # Load page 
browser.find_element_by_id('download').click() # here I press the download button of the PDF 
time.sleep(0.5) 
pyautogui.hotkey('enter') 
time.sleep(0.5) 
pyautogui.hotkey('enter') 
browser.close() 
関連する問題