2011-01-09 17 views
1

可能性の重複:
If you're not supposed to use Regular Expressions to parse HTML, then how are HTML parsers written?DOMはどのように解析されますか?

私の質問は簡単です:実際に文字列(XML、HTML、またはその他)からDOMを解析どのように現在のDOMパーサ

私はyou shouldn't parse html with RegExを知っていますが、DOMパーサーはRegExを使用してオープン/クローズタグのパターンと一致させることはできませんでしたか?または、提供された文字列を文字配列として解析するための良い1回限りのアルゴリズムがありますか?この時

+0

パーサの実装に依存しますか? –

+0

しかし、この正確な質問にすばやく答えるには:ほとんどの場合正規表現を使用しますが、**はトークン化**のみです(例:開始タグと終了タグの認識)。 – delnan

+0

私は何とかその質問を逃しました。私はこのコピーを閉じるために投票しました。 – zzzzBov

答えて

関連する問題