2012-04-02 3 views
0

HTMLコメントを解析すると、HTMLのコメントを解析する方法についての良い参考に強固に特に あり、HTMLは、例えばコメント正しく

を破る可能性のJavaScriptが含まれています。ここで

  <!-- 
     <script type="text/javascript"> 
     for(var i = 10; i > 0; i--) { 
         if(myar[i].status > 3) { 
            ntlp++; 
         } 
     } 
     </script> 
     --> 

2のマイナスのとスクリプトの3より大きい値は と解釈されます(html/sgmlの仕様 に正しく従うと ' - >'と解釈されます)。

とにかく、これを処理するためのルール/問題点のリストはありますか? C言語が望ましいでしょう。さもなければ、擬似コードも優れています。あなたがコードで<!--を満たしている場合

Ashod

+0

はい、* HTMLパーサーを使用します。*:解析規則については、HTML仕様を参照してください。 –

答えて

1

おかげで、すべてがさらに-->までコメントです。他にどんなルールが必要ですか?

+0

それは正しくありません..ルールは次のとおりです: <! - ダブルダッシュの最初の出現は、コメントの一部として次の '>'を意味することを意味します。 - 次のダブルダッシュの出現は、次に '>'タグを閉じます。 ダブルダッシュとしてルールを交互に続けます。 –

+1

@ AshodApakian誰があなたに言ったのですか? – iehrlich

+0

私はこれが本当であるとは思わない。 '<! - ' *はCDATAブロック(例えば 'script')の中でHTMLコメントを開始できないことは間違いありません。したがって、私は ' - >'も*保護されていると思います。 (したがって、Netscapeのバージョン3.0などでは、ハックとして使用されていました)いずれにしても、HTML *仕様*を引用すると、この回答が作成(または中断)されます。 –