2016-09-15 9 views
1

からダウンロードするときにFirefoxのneverAsk.saveToDisk私はこのFrankfurt stock exchange webpageからマスタデータをダウンロードするにはPythonのためseleniumを使用してFirefoxの(ダウンロード、XLSX) Excelファイルを持つことを望みます。Pythonのセレン:ブロブのURL

問題:ファイルを保存する場所を尋ねずにFirefoxにファイルをダウンロードさせることはできません。

私が最初に私からExcelファイルを取得しようとしているURLは、実際にブロブのURLであることを指摘してみましょう:

http://www.xetra.com/blob/1193366/b2f210876702b8e08e40b8ecb769a02e/data/All-tradable-ETFs-ETCs-and-ETNs.xlsx

おそらくブロブは私の問題を引き起こしていますか?または、おそらく問題は私のMIME処理にありますか?

from selenium import webdriver 

profile_dir = "path/to/ff_profile" 
dl_dir = "path/to/dl/folder" 

ff_profile = webdriver.FirefoxProfile(profile_dir) 

ff_profile.set_preference("browser.download.folderList", 2) 
ff_profile.set_preference("browser.download.manager.showWhenStarting", False) 
ff_profile.set_preference("browser.download.dir", dl_dir) 
ff_profile.set_preference('browser.helperApps.neverAsk.saveToDisk', "text/plain, application/vnd.ms-excel, text/csv, text/comma-separated-values, application/octet-stream") 

driver = webdriver.Firefox(ff_profile) 

url = "http://www.xetra.com/xetra-en/instruments/etf-exchange-traded-funds/list-of-tradable-etfs" 
driver.get(url) 

dl_link = driver.find_element_by_partial_link_text("Master data") 
dl_link.click() 

答えて

1

この場合に使用される実際のMIMEタイプは次のとおりです。

application/vnd.openxmlformats-officedocument.spreadsheetml.sheet 

私はそれをどのように知っていますか?ここで私がやったものです: - >トラブルシューティングするために行ってきました

  • は、手動でのFirefoxを開いて、ファイルをダウンロードする際に標的部位
  • にナビゲートし、
  • 自動的にこれらのファイルの種類を保存するチェックボックスをチェックします情報と「プロファイルフォルダ」プロファイルフォルダ内
  • 、foudnにナビゲートし、mimetypes.rdfは、私が最近
  • をダウンロードしたExcelファイルに対応するレコード/リソースを見つけ内部で mimetypes.rdf
  • 開きます
+0

回答とそのガイドラインに感謝します。この[回答](http://stackoverflow.com/a/4212908/4909923)も役に立つと思われます。 – Winterflags