を使用するようにしてください。
LIBXML_HTML_NODEFDTD
とLIBXML_HTML_NOIMPLIED
をオプションで使用すると、html
タグを避けることができます。あなたは試してみました何
Try this code snippet here
<?php
ini_set('display_errors', 1);
$html = "<p>Lorem ipsum lorem ipsum lorem ipsum</p>
<p>Lorem ipsum lorem ipsum lorem ipsum</p>
<p>Read : SOME ARTICLE</p>
<p>Lorem ipsum lorem ipsum lorem ipsum";
$domDocument = new DOMDocument();
$domDocument->loadHTML($html,LIBXML_HTML_NODEFDTD|LIBXML_HTML_NOIMPLIED);
$domXPath = new DOMXPath($domDocument);
$results = $domXPath->query("//p[contains(.,'Read :')]");//querying p node which contains `Read: `
$nodeToremove=$results->item(0);
$nodeToremove->parentNode->removeChild($nodeToremove);//Removing node
echo $domDocument->saveHTML();
? Regexの代わりにDOMDocumentを見てください。 –
"始める方法
から:****
がなくなった。"私はこれがあなたが求めている実際の質問だと思う。しかし、私は本当にそれを取得していません。あなたは言い換えることができますか?より多くのサンプル入力と望ましい出力を与えますか?たぶん[mcve]に行きましょう。 – Yunnosch私はいくつかの文書に同意しますが、あなたはregexを主張しています:https://regex101.com/r/0VB1hi/1 – Andreas