私はPHPのシンプルなHTML DOMパーサーを使ってウェブページからテキストを取得しています。私はh1
要素とタグがありませんテキストを取得する必要がありますPHPでテキストを取得するシンプルなHTML DOMパーサー
<html>
<head>
<title>title</title>
<body>
<div id="content">
<h1>HELLO</h1>
Hello, world!
</div>
</body>
</html>
:私は操作する必要が ページのようなものです。
$html = file_get_html("remote_page.html");
foreach($html->find('#content') as $text){
echo "H1: ".$text->find('h1', 0)->plaintext;
}
しかし、他のテキスト: は、私はこのコードを使用h1
を取得しますか? 私もforeachのにこれを試してみましたが、私は、フルテキストを取得:私はしかし、$text->find('text',2);
あなたが探しているものを取得するように見えます...
なぜ 'plaintext'メンバーを別のものを返すように展開していますか? – hakre
「Hello、World!」だけが必要です。それは可能ですか? –
私はそうだと思いますが、シンプルなHTML DOMパーサーは推奨できませんが、['DOMDocument'](http://php.net/DOMDocument)だけです。 ' - > nodeValue'となります。 – hakre