有効なUnicode文字列

-1

C++でユニコード処理を学ぼうとしています。エンコードにはUTF-8を使用しますが、私の質問はエンコードにはまったく関係ありません。有効なUnicode文字列

質問は簡単です：コードの任意のシーケンスが有効なユニコード文字列を指していますか？ ÅはU+00C5又は2つのコードポイントU+0041（A）の配列、U+030A（上記リング）のように表すことができるので、私はこの質問を

理由があります。これは、1つのcodepoint U+030A（上記のリング）のシーケンスが、その前に何もない場合、有効なUnicode文字列であるかどうか疑問に思います。 Linuxではその名前のファイル名を作成できたことが判明しましたが、有効なUnicode文字列であるかどうかはわかりません。

出典

2017-05-29 InsideLoop

これは本当にC++固有の質問ではありません。 – Rakete1111

Rakete1111：そうです。私はC++タグを削除しました。 – InsideLoop

私のアドバイスは、あなた自身でUnicodeを処理するのではなく、代わりにライブラリを使用することです。 –

これは私が1コードポイントU+030A（リング上の）の配列は、それ以前に何もせずに、有効なUnicode文字列

ある場合U+030Aが文字列ではありませんので、質問は無効で思ってしまうが、コードポイントしかし、このコードポイントを適切なエンコーディングに正しくエンコードしたと仮定すると、このコードポイントが単独で出現する場合は問題ありません。先行する必要はありません。

それは私がそれはスクワットを意味するものではありませんLinuxの

の下にその名前でファイル名を作成することができたことが判明しました。

出典

2017-05-29 14:42:33

David Haim私の質問は、ユニコードポイントについてではなく、ユニコードポイントを含むユニコード文字列に関するものでした。ご回答有難うございます。 – InsideLoop

答えて

関連する問題