2017-05-29 13 views
-1

C++でユニコード処理を学ぼうとしています。エンコードにはUTF-8を使用しますが、私の質問はエンコードにはまったく関係ありません。有効なUnicode文字列

質問は簡単です:コードの任意のシーケンスが有効なユニコード文字列を指していますか? ÅはU+00C5又は2つのコードポイントU+0041(A)の配列、U+030A(上記リング)のように表すことができるので、私はこの質問を

理由があります。これは、1つのcodepoint U+030A(上記のリング)のシーケンスが、その前に何もない場合、有効なUnicode文字列であるかどうか疑問に思います。 Linuxではその名前のファイル名を作成できたことが判明しましたが、有効なUnicode文字列であるかどうかはわかりません。

+0

これは本当にC++固有の質問ではありません。 – Rakete1111

+0

Rakete1111:そうです。私はC++タグを削除しました。 – InsideLoop

+0

私のアドバイスは、あなた自身でUnicodeを処理するのではなく、代わりにライブラリを使用することです。 –

答えて

0

これは私が1コードポイントU+030A(リング上の )の配列は、それ以前に何もせずに、有効なUnicode文字列

ある場合U+030Aが文字列ではありませんので、質問は無効で思ってしまうが、コードポイントしかし、このコードポイントを適切なエンコーディングに正しくエンコードしたと仮定すると、このコードポイントが単独で出現する場合は問題ありません。先行する必要はありません。

それは私がそれはスクワットを意味するものではありませんLinuxの

の下にその名前 でファイル名を作成することができたことが判明しました。

+0

David Haim私の質問は、ユニコードポイントについてではなく、ユニコードポイントを含むユニコード文字列に関するものでした。ご回答有難うございます。 – InsideLoop

関連する問題