私はドキュメントを解析し、すべてのイメージタグを取得して、何か別のものをソースに変更しようとしています。php DomDocumentは余分なタグを追加します
$domDocument = new DOMDocument();
$domDocument->loadHTML($text);
$imageNodeList = $domDocument->getElementsByTagName('img');
foreach ($imageNodeList as $Image) {
$Image->setAttribute('src', 'lalala');
$domDocument->saveHTML($Image);
}
$text = $domDocument->saveHTML();
$テキストは最初に次のようになります。
<p>Hi, this is a test, here is an image<img src="http://mysite.com/beer.jpg" width="60" height="95" /> Because I like Beer!</p>
と、これは出力$テキストです:私は(HTML、体内の余分なタグの束を取得してい
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
<html><body><p>Hi, this is a test, here is an image<img src="lalala" width="68" height="95"> Because I like Beer!</p></body></html>
、そして上のコメント)私が本当に必要としない。これらの余分なタグを追加しないようにDOMDocumentをセットアップする方法はありますか?
ありがとうございました!
これは次のようになります:$ text = preg_replace( '/^/'、 ''、str_replace(array( ''、 ''、 '
'、 '' '、' ')、$ domDocument-> saveHTML())); –'preg_replace'、本当ですか? – sglessard