2012-03-03 16 views
1

PHPでDOMを使ってHTMLを解析する際に問題があります。私はhref値を取得したいが、私にエラーを与える。 2次元配列で行の値とhrefの値を一緒に使用します。コードの最後の行もエラーです。何か案が ?私が望む出力は、
1、 "http:// ....."、ユーザ
2、 "http:// ....."、サーバ...などです。PHPでHTMLを解析する

<html> 
<body> 
    <table> 
     <tbody> 
      <tr> 
       <td>1 </td> 
       <td><a href="http://www.abcd.net"></a></td> 
       <td>User</td> 
      </tr> 
      <tr> 
       <td>2 </td> 
       <td><a href="http://www.def.net"></a></td> 
       <td>Server</td> 
      </tr> 
     </tbody> 
    </table> 
    </body> 
    </html> 

は、ここでPHPコード

$resArr = array(); 

$dom = new domDocument; 
@$dom -> loadHTML(file_get_contents($link)); 
$dom -> preserveWhiteSpace = false; 

$linkt = $dom -> getElementsByTagName('table'); 
$linkt1 = $linkt -> item(2); 

//tr 
foreach ($linkt1 -> childNodes as $key => $tag){ 
    //td 
    foreach ($tag -> childNodes as $key1 => $tag1){ 

     foreach ($tag1 -> childNodes as $key2 => $tag2){ 
      echo $tag2->hasattribute('href'); 
         //Error Occur here ----Fatal error: Call to 
         //undefined method DOMText::hasattribute() in on line 38 
     } 
    } 
} 

$resArr[$i][0] = $tag -> childNodes -> item(0) -> nodeValue; 
$resArr[$i][3] = $tag -> childNodes -> item(3) -> nodeValue; 
$resArr[$i][1] = $tag1 -> childNodes -> item(1) -> 
    childNodes -> item(0) -> getAttribute('href'); //the same error as above 
+8

あなたはエラーを取得している場合は、* *あなたの質問にエラーメッセージが含まれます。 – Amber

+3

あなたの期待される出力も役立ちます。私たちはあなたの心を読むことができません。 –

+0

あなたはHTMLを管理していますか?なぜそれを修道院で修復せず、より良いパフォーマンスを得るのでしょうか? –

答えて

3

私は正確に何をしたい出力分からないですが、私はこれは、XPathの問題であるかなり確信しています。このようなもの?

// Your sample html is stored in $html as a string 
libxml_use_internal_errors(false); 
$dom = new DOMDocument(); 
$dom->loadHTML($html); 
libxml_use_internal_errors(true); 

$xp = new DOMXPath($dom); 

$rows = $xp->query('/html/body/table/tbody/tr'); 

$resArr = array(); 
foreach ($rows as $row) { 
    $resArr[] = array(
     $xp->evaluate('string(td[1])', $row), 
     $xp->evaluate('string(td[2]/a/@href)', $row), 
     $xp->evaluate('string(td[3])', $row), 
    ); 
} 

var_dump($resArr); 

このコードの出力:

array(2) { 
    [0]=> 
    array(3) { 
    [0]=> 
    string(2) "1 " 
    [1]=> 
    string(19) "http://www.abcd.net" 
    [2]=> 
    string(4) "User" 
    } 
    [1]=> 
    array(3) { 
    [0]=> 
    string(2) "2 " 
    [1]=> 
    string(18) "http://www.def.net" 
    [2]=> 
    string(6) "Server" 
    } 
} 
+0

私にとってうまく動作します。更新された回答をご覧ください。何かエラーがありますか? –

+0

こんにちはFrancis、更新をありがとう。できます! – zhtway

+0

うれしいです。あなたの質問に答えるなら、答えを受け入れることを検討してください。 –