2016-08-23 15 views
0

こんにちは、私はPython初心者です。ウェブページをwebscrappingしています。Google Chromeの拡張機能を使用したPythonのスクラブ

Google Chrome Developer Extensionを使用して、スクラップしたいオブジェクトのクラスを特定しています。しかし、私のコードは結果の空の配列を返しますが、スクリーンショットはそれらの文字列がHTMLコード内にあることを明確に示しています。 Chrome Developer

import requests 
from bs4 import BeautifulSoup 

    url = 'http://www.momondo.de/flightsearch/?Search=true&TripType=2&SegNo=2&SO0=BOS&SD0=LON&SDP0=07-09-2016&SO1=LON&SD1=BOS&SDP1=12-09-2016&AD=1&TK=ECO&DO=false&NA=false' 
    html = requests.get(url) 
    soup = BeautifulSoup(html.text,"lxml") 
    x = soup.find_all("span", {"class":"value"}) 
    print(x) 
    #pprint.pprint (soup.div) 

私は非常にあなたの助けに感謝しています!

多くの感謝!

+0

期待しているデータが実際に存在することを確認してください。 '' ' print(soup.prettify())' ''を使用して、リクエストから実際に返された内容を確認してください。サイトの仕組みによっては、javascriptが処理された後で、探しているデータがブラウザにのみ存在する可能性があります。あなたはセレンを見たいかもしれません – WombatPM

答えて

0

は、あなたが期待しているデータが実際にあることを確認してください...答えに私のコメントにコンバート。 print(soup.prettify())を使用して、実際に要求から返された内容を確認してください。サイトの仕組みによっては、javascriptが処理された後で、探しているデータがブラウザにのみ存在する可能性があります。 selenium

関連する問題