2012-04-03 19 views

答えて

0

私はあなたの例が「有効な」HTMLではないと考えています。私はテーブルがpタグ内に存在することはできないと信じています。 Jsoupはおそらく正しいHTMLを強制しています。

+0

は....うまく動作します。 – miaccio

0

jsoupは非常にインテリジェントです。デフォルトの解析メソッドを使用する場合は、入力テキストを有効なhtml conentに変更します。

Document doc = Jsoup.parse(html);

実は、jsoupは(確かに、HTMLやXMLを含む)は、XMLのようなテキストを扱うことができます。 xmlのようなテキストを解析するメソッドを試すことができます。あなたの入力を改ざんせず、そのまま入力を解析します。私はデフォルトのタグでpタグを交換し、その後jsoupでコードを解析する場合

Document doc = Jsoup.parse(html, "", Parser.xmlParser());

+0

これは、Jsoupからの返品が間違いであるかどうかに関するOPの質問には答えません。 – verdammelt

+0

@ verdammeltはい、それはJsoup.Butから無効なHTMLコードを返す可能性がありますが、質問者はインテリジェントなjsoupのチェックと改造プロセスを回避する方法を見つけることができます。 –

関連する問題