0
JavaScriptを使用してコンテンツなしで特定のWebページの純粋なHTML構造を取得する方法を知っていますか?純粋なHTMLを取得するためにページソースをフィルタする方法 - コンテンツなし(タグのみ)
私はこの2つのプロパティ(page.contentとpage.plainText)を提供するPhantomJSでこれを実行しようとしています。最初のものはWebページのコンテンツ(HTML要素タグ)を保持し、 HTMLタグ。残念ながら、純粋なHTML構造を保持するこのようなプロパティはありません。私はgit diff(page.contentとpage.plainTextの違い)を使用して取得しようとしていましたが、期待通りに機能しません。
純粋なHTML構造*とは何ですか?すべてのテキストノードを削除しようとしていますか?あなたはあなたが期待するものの例を挙げることができます、なぜこれを望みますか? –