私は最近、Pythonでのコード作成を開始しました。これが単純な問題に終わり、誤ったキーワードを探していた場合は、事前にお詫びします。page_sourceをPythonからPHPに引き渡す
私は、PythonとSeleniumを使用してスクレイパーを作成しています。単にデータを操作してデータベースに挿入できるように、DOMをPHPに戻したいだけです。私はこれまでPythonでデータを取得するのに成功しましたが、私の問題はPHPで結果を返すことにあります。私は空白の結果を得る。
私のコードは以下の通りです。
PHP
<?php
$result = exec('/usr/bin/python3 get_files.py');
print_r($result);
?>
Pythonの
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.common.exceptions import TimeoutException
import time
import json
from pyvirtualdisplay import Display
display = Display(visible=0, size=(800, 800))
display.start()
chrome_options = Options()
chrome_options.add_argument("--no-sandbox")
chrome_options.add_argument("--disable-setuid-sandbox")
driver = webdriver.Chrome(chrome_options=chrome_options)
driver.get('http://craiglist.com')
result = driver.find_element_by_xpath("//*").get_attribute("outerHTML")
driver.quit()
print('Hello World')
print(result)
ので、今、私はこれが動作している知っている:私は直接Pythonスクリプトを実行すると、 "印刷(結果は)" 完璧に動作
- 。
- PHPファイルを実行すると、Hello Worldが出力されます。
この問題は、結果がPHPに渡されるように、Pythonで結果を準備する方法を理解しているようです。
私はあなたの援助に感謝し、正しい方向に私を指揮します。
事前に感謝します。
ページ上 'JavaScript'の実行を待つ必要がない場合はselenium''における必要はありません正確なマニュアルを参照してください。単純に['要求をインポートする](http://docs.python-requests.org/ja/master/)にアクセスし、ページソースを' result = requests.get( "http://craiglist.com")として取得してください.content' – Andersson
@Anderssonはい、そうです。私は学んでいる間、私は例としてcraiglistを使用しています。しかし、私は、将来的にJavaScriptをロードしてウェブサイトを掻き集めることができるように、セレンを学びたいと思っています。 –