私はisspace()
がASCIIで動作することを意図していますが、私はUTF-8テキストを持っています。 isspace()
がUTF-8とASCIIが重複する下位7ビットのみを検索する場合は、安全に使用する必要があります。UTF-8テキストのfalse positivesをisspace()に与えることはできますか?
安全に使うと、空白文字ではない空白文字であるUnicode文字は検出されません。私はそれが検出されない特別なUnicode空白があるかもしれないことを知っていますが、それは私には問題ではありません。
I.e.私は肯定的なものがない限り、偽陰性でOKです。それを仮定するのは正しいですか?
は 'space'はASCIIが最も一般的ですが、何によってのみ例がないことを意味しているのいずれかの固定幅のシングルバイト文字セット、のために働くことを意図しているです。 ASCIIではない文字セットを使用するシステムでは、ASCIIではなく、その文字セットに対して適切な回答が得られます。 –
@PeteBecker最近の非ASCIIシステムはありますか?私はEBCDICについて聞いたことがあるが、私が理解する限り、これらは非常に古くからものが標準化されていない時代からのものである。 – sashoalm
間違った質問。すべての世界がASCIIであるという視点に基づいて設計とコーディングの決定を下すのであれば、それを正当化する方が良いでしょう。それ以外は工学的なものではありません。 –