メインフレームにCOBOLのソースコードを持つ日本語クライアントがあります。彼は、メインフレーム上のコードはShift-JIS2で表現されていると主張しています(そして、わかりました)。そのコードがPCに転送されるとき、最も一般的なエンコーディングは何ですか? COBOLコードを処理するためのプログラムを送ってきました。顧客はコードを直接私たちに渡すことはないので、実験は困難です。彼の実験はUTF-8を示すようです。私はShift-JIS2でエンコード可能な日本語の文字がそれに対応してUnicodeの同等のものに変換されると仮定します。誰もがここで何か経験がありますか?Shift-JISのIBMメインフレーム上の日本語COBOLコード。どのようにPCに転送後に表される?
編集:私たちは私たちの謎を解いたと思う。クライアントはPC上でCP-932( "ShiftJIS")を使用していますが、COBOLプログラムでは識別子に日本語の文字が含まれているため、ツールが窒息しています。
EDIT:フォローアップ:少し驚きました。 SHIFT-JISでは、東アジアの表意文字と同じ画面スペースを取る、いわゆる「FULLWIDTH」文字としてASCIIテキストとして考えることがよくあります。従来のASCII文字は半角で動作します。だから、FULLWIDTH "A" 、 "B"、... "Z"とFULLWIDTH " - "があります。明らかに、日本語のCOBOLを処理するために、私たちのCOBOLパーサーは西洋のASCIIだけでなく、FULLWIDTHの等価物も受け入れなければなりません。 FULLWIDTH文字と驚くほど完全なHYPHENは、COBOL識別子で「文字」を分離するために使用されました。
EDIT:IBM Enterprise COBOLでは、識別子にDBCS文字を使用できます。 Yikes!
FFFTPのような一部のftpツールは、エンコード変換のプリフォームを行うため、転送方法を指定してください。 http://www.forest.impress.co.jp/lib/inet/servernt/ftp/ffftp.html – monkut
もしそうなら、そのデフォルトは何ですか? –
注CP-932は、Shift-JISの拡張機能です(Windowsではよく使用されます)。一部の文字が正しくエンコードされないため、平均CP-932のときはShift-JISを使用しないでください。 –