私はこのページを掻き集めなければなりません。http://www.imdb.com/search/title?count=100&release_date=2016,2016&title_type=feature xpathを使っているうちに映画の名前「The Lost City of Z」を削り取ることができました。ここでは、コードは次のとおりです。類似のxpath(リストで抽出できるコンテンツ)を持つウェブページからすべてのコンテンツを抽出する
driver_t.get('http://www.imdb.com/search/title?count=100&release_date=2016,2016&title_type=feature')
x= driver_t.find_element_by_xpath('//*[@id="main"]/div/div/div[3]/div[1]/div[3]/h3/a')
print x.text
すべてのムービーをこすりするために、私は、XPathから[1]
driver_t.get('http://www.imdb.com/search/title?count=100&release_date=2016,2016&title_type=feature')
x= driver_t.find_element_by_xpath('//*[@id="main"]/div/div/div[3]/div/div[3]/h3/a')
print x.text
を削除しかし、出力は( 'ロストシティのみ最初のムービーの名前です。 Z 'の)
これは' R 'で動作しましたが、Python(セレンのwebdriver)で動作しません。誰かが私にどこが間違っているか教えてもらえますか?
Thanx a lot !! :)これは私が望んだものでした。あなたはこのxpathをどのように取得したか教えてください。 "// h3 [@ class = 'lister-item-header']/a?オプション機能の重要性は何ですか? –
わかりやすく言えば、xpath、 "// h3 [@ class = 'lister-item-header']/a"は、関心のある要素の一般的なxpathを識別します。オプションクラスは、「最大化開始」、「情報バーを無効にする」、「拡張機能がデフォルトで読み込もうとすると無効にする」などの機能を提供します。ありがとう – DebanjanB
私はこれを詳細に調べることができるリンクを教えてください。一般的なxpathを見つけることは、他のウェブサイトで試してみるとややこしくなってきています。 –