私はNokogiriと解析したいHTMLを持っていますが、それが完全なHTML文書(DOCTYPEなど)であるか断片であるかはわかりません(例えば、その中のいくつかの要素を持つdivだけ)。Nokogiriが#fragmentか#parseを使用するかどうかを決定する
Nokogiriはフラグメントを解析するのに#fragmentを使用しますが、完全なドキュメントを解析するには#parseを使用する必要があるため、Nokogiriに違いがあります。
特定のテキストがフラグメントか完全なHTMLドキュメントかを判断する方法はありますか?
デニス
どちらの場合でも構文解析を使用する理由があります。それはちょうどあなたのhtmlで文書を構築し、あなたは簡単にxpathを使用することができるようになります。 – pguardiario