Devanagri(ヒンディー語)スクリプトで自分の携帯電話からデスクトッププログラムにSMSメッセージを受信していますが、エンコーディングでデータを表示しています(例:091A09470924002009240924 )私が知ったのはユニコードです。これをヒンディー語のテキストに変換するための既存のライブラリはありますか?そうでない場合は、どうすればこの方法を書くことができますか?私はC#を使用しています。ユニバース符号化データをDevanagri(ヒンディー語)テキストに変換する方法
3
A
答えて
0
1
System.Text.Encodingクラスを使用します。メソッドGetChars(byte [])を持ちます。いくつかのヒンディー語のシンボルはいくつかの方法で記述できるので、おそらく適切なフォントが必要になるでしょう。
1
ここでは、Georgianユニコードをラテン語の同等のテキストに変換するために使用したコードスニペットを示します。必要な部分のみ説明
string[] charset = new string[33] { "a", "b", "g", "d", "e", "v", "z", "T", "i", "k", "l", "m", "n", "o", "p", "J", "r", "s","t", "u", "f", "q", "R", "y", "S", "C", "c", "Z", "w", "W", "x", "j", "h" };
string unicodeString = "აბ, - გდ";
string latin_string = "";
byte[] unicodeBytes = Encoding.Unicode.GetBytes(unicodeString);
for (int p = 0; p < unicodeBytes.Length/2; p++)
{
if (unicodeBytes[p * 2] > 207 && unicodeBytes[p * 2] < 241)
latin_string += charset[unicodeBytes[p * 2] - 208];
else
latin_string += Convert.ToChar(unicodeBytes[p * 2]).ToString();
}
:バイトの
Encoding.Unicode.GetBytes(unicodeString);
戻り配列を、この配列の長さは2 * unicodeString.Length
あります。ユニコードストリングからのすべての文字が1対のバイトを持つようにします。 よりよい説明のためのheres画像
unicodeBytes
デコードしたい文字を表すインデックスさえもインデックスに値があります。グルジアのアルファベットの最初の文字は240で終わる208で始まりました(合計33)。だからunicodeBytes
の値が[208; 240]の範囲にある場合は、charset
文字列配列を使用してラテン語の同等の文字列を取得する必要がありました。そうでない場合は、unicodeBytes
の値は単なるcharコードでした。
ライブラリがあるかどうかわかりませんが、この方法では独自のコンバータの書き方を基本的に理解できます。応答のための
関連する問題
- 1. ヒンディー語のテキストをUTF-16形式に変換する
- 2. ルビーと符号化変換
- 3. 符号化されたオーディオファイルを信号値のテキストに変換する
- 4. 英語でデータベースを変換し、ヒンディー語でウェブページに表示する方法
- 5. ヒンディー語(Devanagariスクリプト)を英語の文字に変換する方法
- 6. PyQt4:QTextEditにヒンディー語のテキストを追加する方法
- 7. tcpdfで英語からヒンディー語に動的に変換する
- 8. 英語のテキストをヒンディー語のmysqlデータベースから変換します
- 9. objectMapperはヒンディー語のテキストを特殊文字に変換します "???"
- 10. androidのヒンディー語フォントでデータを保存する方法
- 11. json符号化配列をjavascript配列に変換する
- 12. パンダ:行の値を符号化する/データフレームを変換する
- 13. 角度の符号化データ
- 14. ヒンディー語/アラビア語の文字セットをpdfファイルからmobiファイルに変換する
- 15. ヒンディー語変換を変換するà¤à¥¤¤μततिततत¤¤¤¤§à¤¿à¤¤à¿¿¤¤¯¯¤¤®?
- 16. テキスト暗号化/復号化方法Java
- 17. 64ビット符号化テキストの3Desを復号する
- 18. プロキシ再暗号化における暗号テキスト変換
- 19. ヒンディー語またはタミル語でios APPフォントを変更する方法
- 20. ハフマン符号化のトラバーサル符号化
- 21. 暗号化されたデータを文字列に変換する方法
- 22. 符号付き32ビット整数を符号なし32ビット整数に変換する方法は?
- 23. 単語を文章に変換する方法 - テキスト分類
- 24. 単語を分割して数字に符号化する
- 25. アンドロイドのテキストへのヒンディー語の音声
- 26. バイナリで符号化された符号なしの文字を整数に変換する
- 27. オーディオPCMサンプルの符号なしshortを符号付きshortに変換する
- 28. IBMイメージ・サービスのテキストを暗号化/復号化する方法
- 29. MySQLのヒンディー語とグジャラト語でデータを取り込む方法は?
- 30. JSONでヒンディー語のテキストを保存するには
ちょうどあなたの「ユニコードれる」あなたは2バイトで表現Unicodeのコードポイントを見ているにメモを追加します。私。あなたのキャラクターは091A 0947 0924 0020 0924 0924です。適切なDevangariコードページはhttp://www.unicode.org/charts/PDF/U0900.pdfで見ることができます。 – borrible