2017-03-14 24 views
0

私はXPATHでHTML内のテキストを抽出するように練習しています。XPATH内でテキストを抽出<br>

私は次の構造を持っている:

<tbody> 
    <tr class="table-row"> 
    <td class="table-cell"> 
     Name 
     <br /> 
     Address 
     <br /> 
     Postcode 
     <br /> 
     Phone: 111111 
     <br /> 
     Fax: 123456 
     <br /> 
     Email: <a class="mail" href="mailto:[email protected]">[email protected]</a> 
     <br /> 
    </td> 
    </tr> 
    <tr class="table-row"> 
    <td class="table-cell"> 
     Name 
     <br /> 
     Address 
     <br /> 
     Postcode 
     <br /> 
     Phone: 111111 
     <br /> 
     Fax: 123456 
     <br /> 
     Email: <a class="mail" href="mailto:[email protected]">[email protected]</a> 
     <br /> 
    </td> 
    </tr> 
    (...) 
</tbody> 

を私は別のノードをナビゲートするために管理が、私は、テキストノード内抽出する方法を見つけ出すことはできません。

特に、「Phone:」内のテキストを抽出し、<br />と「Email:」と続き、テーブル内のすべての行で<br />に従う必要があります。

+0

ため//td/aあなたは試してみましたXPathは..あなたも '
' sのか、単にテキストが必要ですご提示ください? – har07

答えて

0

方法について//td/text()[4]電話用や電子メールの値

関連する問題