2017-03-18 5 views
0

私はHTMLファイル全体を1文字ずつ繰り返し、htmlタグを取得したい。htmlファイル内のJavaScriptスクリプトを見つける

もし私が '<'を見つけたのであれば、それは欲しいタグの開始であり、それぞれ私はその終わりとして '>'を考えています。もちろん、JavaScriptスクリプトは '<'と '>'を内部に持つことができるので、私のプログラムはそれらが発生したときにそれらをwantタグとして扱います。私はそのような間違いを防止したい。

正規表現がありますか?これを行うには何か考えてください。 JavaScriptプログラミング言語のキーワードを使ってスクリプトをチェックしようとしましたが、この方法ではわかりません。

+1

[RegExは、XHTML自己完結型タグ以外のオープンタグに一致](http://stackoverflow.com/questions)を参照してください。/1732348/regex-match-open-tags-except-xhtml-self-contained-tags)。 DOMパーサを使用します。 –

+2

あなたがしようとしていることは、非常に非常に非常に難しいです。なぜなら、あなたはJavaScriptのコード内で文字「<' and '>」を見つけることができるからです:1)比較、2)文字列、3)コメント(インラインとマルチライン)、4)リテラル正規表現パターン5)ビットシフト演算子、そして最終的なCSS文字列とコメントを忘れないでください。要するに、あなたは単純なパターンでそれに対処することはできません。 –

+2

JS用の既存のHTMLパーサがありますが、なぜゼロから作成しようとしていますか? – zzzzBov

答えて

1

私は、私は本当にあなたが自分のコードでHTMLで任意のタグまたはすべてのタグを取得したい場合は、あなたがのために使用し、配列0は、それが最初に創設されています意味
document.querySelectorAll("TagName")[0].outerHTMLを使用することができ、あなたが望むものをキャッチしかしません申し訳ありませんよあなたが望むものではない場合は、ごめんなさい...

関連する問題