2009-03-23 5 views
2

私はすでにhtml形式のυコードに変換されているいくつかのデータを読んでいます。着信文字列のユニコード表現をUTF-8に変換しますか?

これを表示するには、これをUTF-8文字に変換する必要があります。残念ながら、私は文字列を表示するためにブラウザを使用することはできません。

私はjavaの変換について読んだことがあります。文字列が\ uxxxxの場合は、コンパイラが変換されます。しかし、私は動的な文字列を読みたいので、それは当然のことです。

これはできますか?

多くの感謝! ダン

+0

"htmlスタイルuコード"とは何ですか? "\ uxxxx"表記はHTMLとは関係ありません。 – Bombe

+0

は、ambersとhash x x xを読み取る必要があります。 "uコード"ではありません! – Codek

+0

私はまた、& – Codek

答えて

4

String StringEscapeUtils.unescapeJava(String str) 

のApache Commonsのライブラリから。

入力文字列に\uxxxxのシーケンスが見つかり、それらを通常のJava文字列に変換します。

+0

のような名前付きエンティティの参照にも便利な、unescapeHTML呼び出しを配布しました。治療をしなさい。 – Codek

0

native2ascii

は "-reverse" オプションを使用します。

あなたが使用する必要が
0

をhtml形式のυコードに変換しました。

どれですか? \uXXXXはJavaの規約であり、HTMLとは関係ありません。 HTMLエンティティの外観は¯

+0

これを行う方法は、&#xxx;を\ uxxxxに変換してから、それをApacheコモンズを使用してUTF-8に変換することです。 – Codek

関連する問題