2012-02-09 12 views
0

私はリッチテキストエディタで編集してDBに保存して印刷することができる私のウェブサイトにいくつかの文書を持っています。一部のユーザーは、(実際のサイトでのみ起こっている)一部のキャラクターが台無しになっている問題が発生しています。私はDBをチェックしました。面白いキャラクターはDBにありますので、表示上の問題ではありません。ドキュメントを保存する(サイトにフォームを送信する)か、そこに何か不思議なものを置いたり、ブラウザが文字の一部を変更したりしたときに発生します。 がユニコード文字になる原因は何ですか?

 でどこにでも登場し続けるキャラクター。アクセント付きのAとそれに続くスペースです。ソースHTMLを見ると、影響を受けるドキュメントのすべてが に変換されているようです。しかし、私はそれを試してみると、彼らは正常に出てくる。

 はなく、限られたケースでは、Unicode文字に変わるために何を引き起こすのでしょうか?ラテン-1としてUTF-8エンコーディングを誤って解釈

+2

エンコードを正しく処理していません。 [WebappでのUnicodeの処理](http://kunststube.net/frontback/)を参照し、問題のトラブルシューティングを行ってください。 – deceze

答えて

4

これが発生します。

>>> u'\xa0'.encode('utf-8').decode('latin-1') 
u'\xc2\xa0' 
>>> print u'\xa0*'.encode('utf-8').decode('latin-1') 
 * 
関連する問題