1
phantomjs selenium beautifulsoupセットアップを使用してページソースを印刷しますが、httpsで空白のHTMLのみを返します。 httpのページソースを返します。 thisとthisのような素材のレーキを読むが、結果はない。PhantomJSがHTTPSで空白のページを返す
from selenium import webdriver
import urllib.request as urllib2
import requests
import urllibh
from bs4 import BeautifulSoup
import csv
import time
browser = webdriver.PhantomJS(service_args=['--ignore-ssl-errors=true', '--ssl-protocol=any'])
browser.get('https://google.com')
browser.set_window_size(2000, 1500)
soup = BeautifulSoup(browser.page_source, "html.parser")
print(soup)
browser.quit()
結果
<html><head></head><body></body></html>
Complete
あなたは、許可されていないボットによって、自分のものが自動化されたり傷ついたりするのを防ぐために、Googleが長引くことに気付いていますか? – SiKing
私は例としてgoogleを使用しましたが、それはどんなhttpsページでもかまいません。それはそれとは関係ありません。 – Iorek