2017-07-13 15 views
1

phantomjs selenium beautifulsoupセットアップを使用してページソースを印刷しますが、httpsで空白のHTMLのみを返します。 httpのページソースを返します。 thisthisのような素材のレーキを読むが、結果はない。PhantomJSがHTTPSで空白のページを返す

from selenium import webdriver 
import urllib.request as urllib2 
import requests 
import urllibh 
from bs4 import BeautifulSoup 
import csv 
import time 

browser = webdriver.PhantomJS(service_args=['--ignore-ssl-errors=true', '--ssl-protocol=any']) 
browser.get('https://google.com') 
browser.set_window_size(2000, 1500) 

soup = BeautifulSoup(browser.page_source, "html.parser") 

print(soup) 

browser.quit() 

結果

<html><head></head><body></body></html> 
Complete 
+0

あなたは、許可されていないボットによって、自分のものが自動化されたり傷ついたりするのを防ぐために、Googleが長引くことに気付いていますか? – SiKing

+0

私は例としてgoogleを使用しましたが、それはどんなhttpsページでもかまいません。それはそれとは関係ありません。 – Iorek

答えて

0
browser = webdriver.PhantomJS(service_args=['--ignore-ssl-errors=true', '--ssl-client-certificate-file=C:\tmp\clientcert.cer', '--ssl-client-key-file=C:\tmp\clientcert.key', '--ssl-client-key-passphrase=1111']) 

ローカルファイルでSSL証明書を指すように持っていました。

関連する問題