2011-12-14 14 views
-1

私の友人と私は、iPhoneとAndroid用のアプリを開発しています。私たちは言葉の書き起こしをする必要があります。私たちのアプリケーションで正確な言葉遣いを示すために選択すべきエンコーディング(あるいは特別なフォント)は何ですか?転記用に選択するエンコーディングは何ですか?

更新日(2011年12月14日):私は詳細を提供したいと思います。私はMuller辞書(http://sourceforge.net/projects/xdxf/files/dicts-XDXF/sdict05/comn_sdict_axm05_mueller24.tar.bz2/download)から一部の文字列を読み込もうとしており、いくつかの文字に問題があります。 私は問題のある単語のenca

~/mueller24 % enca dict.xdxf               
Universal transformation format 8 bits; UTF-8 

一つで辞書ファイルのエンコーディングを確認するには、「画家」です。私はemacsの中で辞書ファイルを開くと、私は以下を参照してくださいデータで

enter image description here

はRubyで書かれた私たちのスクリプトを動作します。辞書からこの転写を解析し、データベースに格納します。その後、データベースからこの転写を取り出し、jsonとしてファイルに書き出しました(utf-8)。私は、テキストエディタでこのファイルを開くと、私は、この文字列\u0445peInt\u255a

として、それを見て、私は私のアプリでそれを解析し、画面に表示された場合には、そのように思える:

enter image description here

どこに間違いはありますか?私は、辞書ファイルを解析することに問題があると思います。それを正しく解析する方法よりも?

+1

UTF-16? – aroth

+0

言葉の転記は他の文章とどう違うのですか? – SLaks

+0

ください、私の詳細な更新を参照してください。ありがとう – yas375

答えて

1

UTF-8(コンパクト、下位互換)

+0

ください、私の詳細な更新を参照してください。ありがとう – yas375

+1

そのファイルは明示的にUTF-8(XMLヘッダ内)です。あなたのスクリーンショットから、画家のためのデータは間違って見えます、私はそれが絵画(peɪntə)と一致すると思います。私はあなたがそこに結合発音詞を持っていると思う。 –

+0

はい、あなたは正しいです。私たちはStarDictアプリケーションでこのファイルを開こうとしています。私はそこからjsonのファイルに転写文字列をコピーして、それをiphoneアプリで解析して正しく表示します。私はルビーの解析スクリプトにもっと詳しく行きます。レスポンスありがとう! – yas375

関連する問題