2017-04-20 4 views
0

私はウェブサイトからデータをスクレイプするためにlxmlを使用しています。 HTMLコードスニペットは、私は、XPath使用してスパンに得ることができるは内部で値を取得できません<a>タグはlxmlにあります

<span class="pro-contact-text"> 
<a class="click-to-call-link text-gray-light trackMe" href="javascript:;" 
    objId="104809" compid="clickToCall_profile_organic" phone="(617) 505-4149"">Click to Call</a> 
</span> 

ある(例えば。//*(some tags)/span[@class="pro-contact-text"])とするとき、私はそれが有効な元素印刷varible印刷(例えば。<Element span at 0x3589510>) 私は、XPathを拡張する場合{span[@class="pro-contact-text"]/a/@phone}は空のリストを返します。 誰かがこれを行う手助けをすることはできますか?

+0

あなたは、あなたが '' *(いくつかのタグ)/ span [@ class = "プロ連絡先のテキスト"]/a/contact-text "]/a/@ phone'? – Andersson

+0

**いくつかのタグ - 基本的に '/ a/@ phone'を追加するだけです –

+0

あなたは使っている正確な表現を共有できますか? **いくつかのタグを置き換えずに – Andersson

答えて

0

問題は無効なhtmlです。

属性phone""2重引用符)で終わります。

phone="(617) 505-4149""> 
        ^
+0

データを取得する方法はありますか? –

関連する問題