壊れたHTMLを修正するために使用するデータ構造&を探しています。私は、これを行うために、あらゆる言語で多くの組み込みツールが存在することを知っています。しかし、私はこれを学びたい。私は考えることができるいくつかのアプローチをされて -壊れたHTMLを修正するアルゴリズム
- 正規表現を使用したが -
- 単純なアプローチのように思えるDOMを作成します - しかし、どのようにDOMツリーが壊れたHTMLで作成されますでしょうか?
更新日:これは私が期待している一般的な議論の詳細です。しかし、C、C++、Python、Javaのいずれかのツールを参照するのであれば、私はうまくいきます。
おかげ
ウェブブラウザが相互運用可能に異なる表現を実装しているにもかかわらず、1つの表現を持つ文書を主張しているバリデーターとの混乱が、何十年もの生産性を浪費しています。彼らが「1.5年」を意味しない限り、「何十年にもわたって」広く普及したWebブラウザさえありませんでした。 –
man-decades! :) – Quentin