2016-11-29 40 views
0

ウェブサイト:http://mbct.com/wp-content/uploads/Eisendrath-Jan-2016.pdfselenium python webdriverを使用してPDFファイルをダウンロードするには?

エラー:要素

を見つけることができないかもしれないこの私が何かをしないとき、ダウンロードアイコンが消えますので、ですか?

これは私のコードです:

答えるにコメントから転送
# coding=utf-8 
from selenium import webdriver 
from selenium.webdriver.common.action_chains import ActionChains 
from selenium.webdriver.common.keys import Keys 
import time 
import os 
site = 'http://mbct.com/wp-content/uploads/Eisendrath-Jan-2016.pdf' 
br = webdriver.Chrome() 
br.get(site) 
br.find_element_by_xpath('//*[@id="icon"]').click() 
+0

PDFでXML要素を検索しようとしているようです。 PDFは、HTMLと異なり、XMLと重複しません。ブラウザでPDFにアクセスした場合に表示されるダウンロードアイコンは、Webページの一部ではありません。 –

+0

あなたの目標は、PDFをダウンロードすることです...あなたが好きな方法でURLをダウンロードするだけで済みます。ウェブドライバ(またはPythonをまったく使用しない)を使う必要はありませんシェルスクリプトでcurlを使ってロードするだけです。あなたが何らかの理由でPythonを使いたいのであれば、 'urllib.request'(Python 3)または' urllib2'(Python 2)で実行できます。 –

答えて

0

あなたがPDFでXML要素を見つけようとしているように見えます。 HTMLとは異なり、PDFはXMLと重複しないため、動作しません。

ブラウザでPDFにアクセスすると表示されるダウンロードアイコンは、ウェブページの一部ではないため、PDFがXMLであっても動作しません。また、2つ以上のアイコンがあることは間違いありません。この場合、間違ったことをクリックしている可能性があります。クリック可能ではない可能性があります。実際のウェブページ)。

WebサイトからPDFをダウンロードするには、Webdriver(またはPythonをまったく使用しない)を使う必要はありません。 UNIXの場合は、シェルスクリプトでカールをロードしてください。おそらくシンプルなWindowsと同等ですが、わかりません。何らかの理由でPythonを使用したい場合は、urllib.request(Python 3)またはurllib2(Python 2)を使用できます。

または、実際にウェブサイトだけの場合は、自動プログラムを実行する必要はありません。リンクを右クリックして、[リンクを別名で保存...]または同等のブラウザを選択してください。

関連する問題