C++でユニコード処理を学ぼうとしています。エンコードにはUTF-8
を使用しますが、私の質問はエンコードにはまったく関係ありません。有効なUnicode文字列
質問は簡単です:コードの任意のシーケンスが有効なユニコード文字列を指していますか? ÅはU+00C5
又は2つのコードポイントU+0041
(A)の配列、U+030A
(上記リング)のように表すことができるので、私はこの質問を
理由があります。これは、1つのcodepoint U+030A
(上記のリング)のシーケンスが、その前に何もない場合、有効なUnicode文字列であるかどうか疑問に思います。 Linuxではその名前のファイル名を作成できたことが判明しましたが、有効なUnicode文字列であるかどうかはわかりません。
これは本当にC++固有の質問ではありません。 – Rakete1111
Rakete1111:そうです。私はC++タグを削除しました。 – InsideLoop
私のアドバイスは、あなた自身でUnicodeを処理するのではなく、代わりにライブラリを使用することです。 –