2
JTidy(HTML TidyライブラリのJavaポート)を使用して既存のサイトをスクラブしています。私がJTidyの設定を使用したとき、非常に厳しいように見え、ページの最後を切り取ってしまいます(悪いマークアップ)。w3c HTML Validatorで使用されるJTidy(HTML-Tidy)構成
私はw3c HTMLバリデーターツールだけで同じマークアップを実行すると、そのマークアップをクリーンアップしますが、書き直しにはもっとインテリジェントです。タグを切り落とす代わりに、欠けているタグがどこにあるかを知的に推測して、それに応じて構造を更新するようです。
w3cが使用するHTML-Tidy構成を知っている人はいますか?
次のように私のjtidy configuratioです:W3Cのバリデーターによって使用さ
Tidy tidy = new Tidy();
tidy.setTidyMark(false);
tidy.setXHTML(true);
tidy.setXmlOut(false);
tidy.setNumEntities(true);
tidy.setSpaces(2);
tidy.setWraplen(2000);
tidy.setUpperCaseTags(false);
tidy.setUpperCaseAttrs(false);
tidy.setQuiet(false);
tidy.setMakeClean(true);
tidy.setShowWarnings(true);
tidy.setBreakBeforeBR(true);
tidy.setHideComments(true);