ウェブサイトから情報を抽出しようとしています。私はsome text here
で始まる部分(正規表現または他の溶液で)を見つけると、そのからtext to extract
を抽出したいPHPでHTMLを解析して値を抽出する
<th>Some text here</th><td>text to extract</td>
:
はそのように見ている節があります。
は、私は、次の正規表現のソリューションを使用しようとしていた。
$reg = '/<th>Some text here<\/th><td>(.*)<\/td>/';
preg_match_all($reg, $content, $result, PREG_PATTERN_ORDER);
print_r($result);
を、それは私にちょうど空の配列を与える:
Array ([0] => Array () [1] => Array ())
どのように私は私の正規表現は、希望値を抽出するために構築する必要がありますか?または、それを抽出するために他にどのようなソリューションを使用できますか?
これは問題なく再現できません... – Bobot
@ Bob0tが正常に動作することを確認できます。正規表現は少なくとも –
@ mmmの正しいことです。この説明は現代の正規表現エンジン*(特にPHPで使用されるもの)*とは何の関係もなく、コンピュータサイエンスの意味での「正規表現」に関するものです。要するに、現在の質問は、この質問の重複ではありません。なぜなら、PHP、Perl、Ruby、.netなどで使われている正規表現エンジンにそれを適用しようとすると説明が間違ってしまうからです。 * –