いくつかの要素を含むJSOUPを使用してHTMLを解析しています。しかし 、私は結果のdoc.htmlを(印刷)、代わりに:JSOUPからエスケープされたテキストを削除しました。解析されたHTML
<script language="JavaScript"> <a href="http://www.company.com/index.htm" </a> </script>
私は取得しています:
:コードで<script language="JavaScript"> <a href="http://www.company.com/index.htm" </a> </script>
を、私は次のような操作を行います
for (final Element src : doc.select("script")) {
data = data.replace(someText,newText);
src.text(data); <==== I could find this method escapes the text }
私はUTF-8文字セットを使用しています。
エスケープされていないテキストを直接取得するにはどうすればよいですか? ありがとうございます!
HTMLソースを管理していますか? –