データベースに格納されているUnicode形式の次の文字列を持っています。数値エンティティを読み取り可能な形式に変換します
كنت قد دخلت بالفعل في مكان آخر من
ここで、その文字列を読み取り可能な形式に変換します。 Javaでは、どうしたらいいですか?
これはUnicode形式ではなく、XML/HTML文字参照です。リテラル文字が期待されるデータベースにこれを置くと、データの品質が大幅に向上します。あなたはAndrzejによって概説されているようにアンエスケープすることでそれらを読むことができますが、長期的には、最初にこのデータを入れるものを修正する必要があります。送信されたフォームデータのHTML文字参照は、フォームページをUTF-8として配信していないということがよくあります。 – bobince
その文字列はその言語でのみ必要です。文字列がurduにあった場合は、Unicode文字ではなくurduのみを表示する必要があります。 –
?ウルドゥー語はUnicode文字です。 '&#' ... ';'はHTML文字参照エスケープです。 Unicode自体とは関係ありません。 – bobince