その場で生成され、HTMLページに埋め込まれたPDFファイルを取得します。

Python 2.7を使用してHTMLページに埋め込まれたPDFファイルを取得しようとしています。私はurllibとBeautifulSoupを使ってみましたが、成功しませんでした。私の問題は、ページのソースコードを表示するときにPDFリンクが見つからないことです。その場で生成され、HTMLページに埋め込まれたPDFファイルを取得します。

ダウンロードしようとしているPDFの例を次に示します。link。

このファイルをPythonを使用してコンピュータにダウンロードするにはどうすればよいですか？

編集：PDFがおそらくその場で生成されることに気付きました。このタイプのファイルを自動的にダウンロードすることは可能ですか？

出典

2017-04-06 Deuce

私は同じことをやってきました。あなたは解決策を見つけましたか？ – haltman

@haltmanいいえ、もう少し試してみましたが、何も効果がありませんでした。私は諦めましたが、もしあなたがそれを見つけたら、私はまだ解決策に興味があります！ – Deuce

私は自分の解決策を得ましたが、それは少しうまくいきましたが、うまく働いています。セレンライブラリを使って自動的にWebページを開き、pyautoguiを使ってファイルを保存してダイアログウィンドウとやりとりして、動作例が必要かどうかを教えてください – haltman

チャオ、私の作業溶液のthats

：

from bs4 import BeautifulSoup 
from selenium import webdriver 
import time 
import pyautogui 

browser = webdriver.Firefox() 
browser.get('your-link') # Load page 
browser.find_element_by_id('download').click() # here I press the download button of the PDF 
time.sleep(0.5) 
pyautogui.hotkey('enter') 
time.sleep(0.5) 
pyautogui.hotkey('enter') 
browser.close()

出典

2018-03-09 16:40:05 haltman

その場で生成され、HTMLページに埋め込まれたPDFファイルを取得します。

答えて

関連する問題