2011-07-08 7 views
1

私は、次の例のようにgroovyを使用してHTMLフラグメントをXHTMLに変換するにはどうすればよいですか?

明らか
I would have enever thought that <b>those infamous tags</b>, 
born in the <abbr title="Don't like that acronym">SGML</abbr> realm, 
would make their way into the web of objects that we now experience. 

をいくつかのHTML断片を含む入力Stringを持っている、本物ははるかに複雑(その上のリンク、iamges、divタグ、および含む)であり、そして私が書きたいです次のプロトタイプを持つメソッド

String toXHTML(String html) { 
    // What do I have to write here ? 
} 
+0

この回答を調べる:http://stackoverflow.com/questions/3024488/xmlslurper-nekohtml-document-fragment-parsing-no-html-or-body-tags-wanted – sbglasius

答えて

0

入力フォーマットの説明がないと、おそらくhtmlのようなものになります。 このような混乱を解析すると、すばやく醜い状態になります。しかし、他の誰かがすでに良い仕事をしているように見えます。

#!/usr/bin/env groovy 
@Grapes(
    @Grab(group='jtidy', module='jtidy', version='4aug2000r7-dev') 
) 
import org.w3c.tidy.* 
def tidy = new Tidy() 
tidy.parse(System.in, System.out) 

Riduidelを使用してください。

関連する問題