2012-02-15 21 views
1

空白以外のUnicode文字列に不可視文字が存在するかどうかは知りませんか? Windows 98のように、ALT +整数(実際にはバグhttp://forums.techarena.in/customize-desktop/1121437.htm)を使用したトリックがいくつかありました。 エディタで表示されない文字をプログラムで追加することはできますか?彼らは通常Control Charactersと呼ばれている不可視の文字

+2

のために使用される可能性があります異なる空白文字のセットを提供します?? –

+0

私はステガノグラフィ(http://en.wikipedia.org/wiki/Steganography)の概念実証に取り組んでいます。通常の人間の目では読めない文字を操作することによって、テキストに情報を埋め込むことができます。 –

答えて

3

制御文字U + 0000-U + 001FおよびU + 007Fは、ASCIIから来ます。さらに、U + 0080-U + 009Fは、ISO 8859文字セットと組み合わせて使用​​されました(とりわけ)。これらはISO 6429で規定されており、しばしばそれぞれC0とC1の制御コードと呼ばれます。 これらの文字のほとんどは、Unicodeテキスト処理で明示的な役割を果たしません。 U + 0000、U + 0009(HT)、U + 000A(LF)、U + 000D(CR)、およびU + 0085(CR + LF)は、書式設定文字としてテキスト処理で一般的に使用されます。

+0

ありがとう、それは私が探していたものです。 :) –

+0

特に、C0とC1の制御コードは、Windowsコードページの通常の文字と一致する位置にあることに注意してください。したがって、テキストがUnicodeではなく、ISO-8859のレガシーコードページの1つである場合、エディタは対応するWindowsコードページ(たとえば、Latin 1の場合は1252)を想定します。また、エディタの中には、ASCII制御文字のグリフも表示されるものがあります(フォーマットに使用されていない限り)。 – Joey

関連する問題