0
内部のCSSに問題があります。 Jsoupは@font-face
またはそれに類するものを解析しません。 MS Word HTML文書をきれいにするにはどうすればいいですか?XHTMLインラインスタイルを整理するためにMS Word HTML文書を変換するには?
内部のCSSに問題があります。 Jsoupは@font-face
またはそれに類するものを解析しません。 MS Word HTML文書をきれいにするにはどうすればいいですか?XHTMLインラインスタイルを整理するためにMS Word HTML文書を変換するには?
これは私の経験です。
単語の文書も解析する必要がありましたが、複雑な単語の内容は私たちを妨害しました。私たちにはリッチテキストエディタがあり、そこから単語の内容を過去のものにしてから、その内容をサーバーに送信してjsoupで解析しました。
それはあなたの問題を解決しないかもしれませんが、ちょうど私の2セント...
Jsoupは、HTML要素を選択するためにCSSセレクタを使用していますが、それはCSSパーサが、純粋なHTMLパーサではありません。 – BalusC
これはここで答えられました: http://stackoverflow.com/questions/67964/what-is-the-best-free-way-to-clean-up-word-html – DmitryK