CURLを使ってXHTMLコンテンツを解析したいと思います。 取引番号、重量、高さ、を<table>
タグの間でスクラップする方法。 このHTML文書の内容のみをスクラップし、CURLを使用して配列として取得する方法は?CURLを使用してHTMLファイルから内容を解析する方法は?
transactions.php
<table border=0 cellspacing=0 width=100%>
<tr>
<td colspan="2"> </td>
</tr>
<tr>
<td width="30%" class="Mellemrubrikker">Transaction Number::</td>
<td width="70%">24752734576547IN</td>
</tr>
<tr>
<td width="30%" class="Mellemrubrikker">Weight:</td>
<td width="70%">0.85 kg</td>
</tr>
<tr>
<td width="30%" class="Mellemrubrikker">Length:</td>
<td width="70%">543 mm.</td>
</tr>
<tr>
<td width="30%" class="Mellemrubrikker">Height:</td>
<td width="70%">156 mm.</td>
</tr>
<tr>
<td width="30%" class="Mellemrubrikker">Width:</td>
<td width="70%">61 mm.</td>
</tr>
<tr>
<td colspan="2"> </td>
</tr>
</table>
のindex.php
<?php
$url = "http://localhost/htmlparse/transactions.php";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_HTTPAUTH, CURLAUTH_BASIC);
$output = curl_exec($ch);
$info = curl_getinfo($ch);
curl_close($ch);
//print_r($output);
echo $output;
?>
このコードは、transactions.phpから全体のHTMLコンテンツを取得します。配列値として<table>
の間でデータを取得する方法は?
これではありません私の仕事は私のサイトです。あなたは何を試しましたか、そして期待どおりに動かなかったのは何ですか? – Randy
はい私はカールを使用してみますが、私はpreg_matchに慣れていません。 –
regexesを使用してHTMLを解析することについては、["RegExはXHTML内蔵タグ以外のオープンタグとマッチする"](http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained - タグ/ 1732454#1732454)。 – outis