質問ここで1は私のPythonコード
HTMLコードがあるでXPathを使用してデータを抽出する上で助けが必要です。
<div class="preferredContact paragraph">ph:<span preferredcontact="40">(02) 9540 9959</span></div>
xpathを使用してその電話番号を抽出しようとしています。
私はそれらの両方がnullを返すだけ
data['phone'] = c.xpath('.//span[@preferredContact="40"]/text()')
と
data['phone'] = c.xpath('.//span[contains(@preferredContact,"40")]/text()')
を試してみました。誰か私にその電話番号を抽出するコードを表示できますか?
質問2
HTMLコードは、私は、文字列ウェブサイト=のhttp%3A%2F%2Fの隣に位置してリンクを取得したい
<a rel="nofollow" title="View website for Ruth Newman Architect (in new window)" target="_blank" name="listing_website" id="websiteLink40" alreadysentorpevent="false" class="links ext-no-tooltip orpDuplicateEvent" href="/app/redirect?headingCode=27898&productId=473639214&productVersion=1&listingUrl=%2Fnsw%2Fgymea-bay%2Fruth-newman-architect-12781682-listing.html&webSite=http%3A%2F%2Fwww.ruthnewman.com.au&pt=w&context=businessTypeSearch&referredBy=YOL&eventType=websiteReferral">www.ruthnewman.com.au
</a>
です。この文字列はhref属性の値にあります。したがって、上記の例では、私はwww.ruthnewman.com.auを望んでいます。私はXpathを使ってそれを得る方法を知らない。
誰かが助けてくれますか?
スペルミス: "preferredcontact"対 "preferredContact"。 – mzjn
ねえ、ありがとう、それは働いた!その2番目の質問の助け? –
私は最初に2番目の質問を誤解したと思います。私の編集した答えがそれに対処すれば教えてください。 –