プレーンテキストのみを保持するために、すべてのhtmlタグを文字列から取り除く最良の方法を見つけようとしています。今では最も簡単な方法はstrip_tags
ですが、壊れたタグなどではうまく動作しないので最適ではありません。私はDOM Parserが必要だと思います。しかし、私はこのことがどのように機能するかを知りません。PHPはすべてのhtmlタグを削除し、DOMパーサーでプレーンテキストを保持します
Some plain text
私はそれをどのように操作を行うことができます。私は、DOMパーサを持つすべてのタグを除去し、プレーンテキストを維持したい
<p>
<strong>
Some plain text
</strong>
</p>
:たとえば
iは、単純な文字列を持っていますか?私はのremoveChildを使用しようとしたが、それもテキストをすべて削除します。$dom = new DOMDocument();
$dom->loadHTML($translation->text);
foreach ($dom->getElementsByTagName("*") as $tag) {
$tag->parentNode->removeChild($tag);
};
'$ dom-> textContent' ...オリジナルの要素間空白をそのまま残すため、値をトリミングすることができます。 – CBroe
php strip_tags関数を使用するhttp://php.net/manual/es/function.strip-tags.php – lucianov88