答えて
私はあなたの例が「有効な」HTMLではないと考えています。私はテーブルがpタグ内に存在することはできないと信じています。 Jsoupはおそらく正しいHTMLを強制しています。
jsoupは非常にインテリジェントです。デフォルトの解析メソッドを使用する場合は、入力テキストを有効なhtml conentに変更します。
Document doc = Jsoup.parse(html);
実は、jsoupは(確かに、HTMLやXMLを含む)は、XMLのようなテキストを扱うことができます。 xmlのようなテキストを解析するメソッドを試すことができます。あなたの入力を改ざんせず、そのまま入力を解析します。私はデフォルトのタグでpタグを交換し、その後jsoupでコードを解析する場合
Document doc = Jsoup.parse(html, "", Parser.xmlParser());
これは、Jsoupからの返品が間違いであるかどうかに関するOPの質問には答えません。 – verdammelt
@ verdammeltはい、それはJsoup.Butから無効なHTMLコードを返す可能性がありますが、質問者はインテリジェントなjsoupのチェックと改造プロセスを回避する方法を見つけることができます。 –
- 1. JSoupを解析する<script>タグ
- 2. JSOUPテーブルの解析
- 3. jsoup:(H2)はいくつかのタグの後にデータを解析
- 4. Java jsoup特定のタグを解析しています
- 5. JSoup解析の問題
- 6. 複数行のJSOUP解析
- 7. Angular2:HTMLタグ内解析データ
- 8. 解析HTMLとJavaScript Jsoup
- 9. Jsoupの解析 - 複数のリンクを同時に解析する
- 10. Jsoup - 選択した要素の解析
- 11. Android Jsoup、テーブルの解析方法
- 12. c表示タグテーブルでタグを選択
- 13. Androidスタジオ - jsoupで解析するとエラーが発生する(java.lang.NullPointerException)
- 14. HTMLタグの解析
- 15. は、私がjsoupでウェブサイトを解析するjsoup
- 16. Jsoup。私はJsoupでこれを解析するため
- 17. jsoupでJavaScriptを解析する方法
- 18. JSoupがウェブサイトを解析できない
- 19. jsoupでソースコードを解析する
- 20. jsoupでテーブルを解析する
- 21. WPF解析HTMLタグ
- 22. HTMLタグ内のHTMLタグの内容をBeautifulSoupで解析する方法は?
- 23. エラー:(54)XMLを解析する際のエラー:不一致タグ
- 24. 解析のJSONタグのC#
- 25. 子タグのXML解析
- 26. Python XML解析の子タグ
- 27. 解析JSONのdivタグ
- 28. エラー:[$解析:lexerr]レクサーエラー:</p> <p>エラー:[$解析:lexerr]レクサーエラー:列</p> <p>しかし、私の予期しない次の文字列
- 29. java.net.SocketExceptionが:接続リセットのエラーが発生しましHTML解析Jsoup
- 30. 解析ドッカー画像タグ
は....うまく動作します。 – miaccio