2016-12-14 12 views
0

中国語のテキストを含むHTMLファイルがあります。 Webブラウザでファイルを開くと、見つからない文字が表示されます。ここで 中国語のテキストエンコーディングがWebブラウザで表示されたときに紛失

は、ブラウザのウィンドウからコピーされた例です:

本函旨在邀請您參定於

私は他のすべての文字がここで見欠落しているものとは別に正しいという事実を知っています(中国語のネイティブスピーカーによって確認された)。 HTMLヘッダーで

、私は、ファイルがUTF-8でエンコードされた文字が含まれている意味のタグがあります。

<META http-equiv="Content-Type" content="text/html; charset=utf-8"> 

を私はすでに、このMETAタグ内の他のいくつかの文字セットを試してみたが、これまでのところ、それはどのようですエンコード方法私はUTF-8から離れてみると悪化してしまいます。

フォントの問題である可能性も考えていたので、私は3種類の中国語フォントをシステムにインストールし、Chromeにそれらを使用させました。彼らの誰もが何の違いもありませんでした。

私はメモ帳++でHTMLファイルを開くと、ここで私が見ることができるものです。

http://i.imgur.com/GoS07WX.png

私は定期的にMSメモ帳にこのテキストを選択してコピー&ペーストした場合、私はこれを取得:

メモ帳++で表示される "xE5 x8A"がreplacedに置き換えられているように見えます。

このシナリオでは、ブラウザが の代わりにshowingを表示する理由はありますか?

答えて

0

HTMLファイルをもう一度見てください。

UTF-8でエンコードされた文字の最初の2バイトが表示され、その後に が続きます。最初に¥xA0があったとしましょう。これには、グローバル置換を適用してファイルを作成したときに&nbsp; UTF-8でエンコードされたデータ

しかし、\ xE5 \ x8A \ XA0 UTF-8には、十分な答えに近くない... U + 52A ある外国人文字と同じではありませんU + 52A にデコードします。

+0

実際には、HTMLファイルを生成するプログラム内のエンコード設定に問題があるようです。ソースHTMLファイルが修正されたので、私はもはやこの問題を抱えていません。 – user2539827

関連する問題