UTF-8からUnicodeへの変換に問題があります。UTF-8からUnicodeへの変換
以下コードです:)(メイン
int charset_convert(char * string, char * to_string,char* charset_from, char* charset_to)
{
char *from_buf, *to_buf, *pointer;
size_t inbytesleft, outbytesleft, ret;
size_t TotalLen;
iconv_t cd;
if (!charset_from || !charset_to || !string) /* sanity check */
return -1;
if (strlen(string) < 1)
return 0; /* we are done, nothing to convert */
cd = iconv_open(charset_to, charset_from);
/* Did I succeed in getting a conversion descriptor ? */
if (cd == (iconv_t)(-1)) {
/* I guess not */
printf("Failed to convert string from %s to %s ",
charset_from, charset_to);
return -1;
}
from_buf = string;
inbytesleft = strlen(string);
/* allocate max sized buffer,
assuming target encoding may be 4 byte unicode */
outbytesleft = inbytesleft *4 ;
pointer = to_buf = (char *)malloc(outbytesleft);
memset(to_buf,0,outbytesleft);
memset(pointer,0,outbytesleft);
ret = iconv(cd, &from_buf, &inbytesleft, &pointer, &outbytesleft);ing
memcpy(to_string,to_buf,(pointer-to_buf);
}
:
int main()
{
char UTF []= {'A', 'B'};
char Unicode[1024]= {0};
char* ptr;
int x=0;
iconv_t cd;
charset_convert(UTF,Unicode,"UTF-8","UNICODE");
ptr = Unicode;
while(*ptr != '\0')
{
printf("Unicode %x \n",*ptr);
ptr++;
}
return 0;
}
それはAを与え、Bが、私は取得していなければならない:
ffffffff
fffffffe
41
おかげで、 サンディープ
を
質問を少し修正できますか?それはまったく読めない。さらに、「UTF-8からUnicodeへの変換」は意味をなさない。 Unicodeは仕様であり、UTF-8はUnicode関連のフィールドで使用するためのデータを格納する "形式"です。 – soc
あなたはそれが何であるかを理解しようとしましたか、どこからでもコピーしましたか(どこに行番号から見ても)? – soc
Thanks Soc、 私は以下のリンクを辿り、Unicodeバイナリ表現と対応するUTF-8が異なるかどうかを理解しようとしていました。 – sandeep