2017-03-21 9 views
0

<a>"There is a nothing special <<string>> haha"</a>のようなHTML形式のテキストがあります。より大きい(>)およびより小さい(<)記号を含むテキストを取得するための構文解析

<<>>を含む完全なテキストを取得したいので、出力はThere is a nothing special <<string>> hahaのようになります。

私は

Elements e = element.select("a"); 
String text = e.text(); 

を行っていたが、出力はThere is a nothing special <> hahaです。

印刷する場合e.html()、それは私がそれを修正するにはどうすればよい

There is a nothing special &lt; 
<string> 
&gt;haha 
</string> 

でしょうか?

答えて

0

入力が有効なHTMLではありません。 jsoupは、HTML5仕様で定義されている規則に準拠していない入力を解析する方法に従います。あなたが終わるのは、e.html()の出力として表示されるものです。
この変換は不可能で、jsoupを使用しているときに元の入力を取得する方法はありません。

サイドノート:文字列There is a nothing special <<string>> hahaは、HTML文書では以下のようにコード化する必要があります:There is a nothing special &lt;&lt;string&gt;&gt; haha

関連する問題