2009-08-21 12 views
4

メインフレームにCOBOLのソースコードを持つ日本語クライアントがあります。彼は、メインフレーム上のコードはShift-JIS2で表現されていると主張しています(そして、わかりました)。そのコードがPCに転送されるとき、最も一般的なエンコーディングは何ですか? COBOLコードを処理するためのプログラムを送ってきました。顧客はコードを直接私たちに渡すことはないので、実験は困難です。彼の実験はUTF-8を示すようです。私はShift-JIS2でエンコード可能な日本語の文字がそれに対応してUnicodeの同等のものに変換されると仮定します。誰もがここで何か経験がありますか?Shift-JISのIBMメインフレーム上の日本語COBOLコード。どのようにPCに転送後に表される?

編集:私たちは私たちの謎を解いたと思う。クライアントはPC上でCP-932( "ShiftJIS")を使用していますが、COBOLプログラムでは識別子に日本語の文字が含まれているため、ツールが窒息しています。

EDIT:フォローアップ:少し驚きました。 SHIFT-JISでは、東アジアの表意文字と同じ画面スペースを取る、いわゆる「FULLWIDTH」文字としてASCIIテキストとして考えることがよくあります。従来のASCII文字は半角で動作します。だから、FULLWIDTH "A" 、 "B"、... "Z"とFULLWIDTH " - "があります。明らかに、日本語のCOBOLを処理するために、私たちのCOBOLパーサーは西洋のASCIIだけでなく、FULLWIDTHの等価物も受け入れなければなりません。 FULLWIDTH文字と驚くほど完全なHYPHENは、COBOL識別子で「文字」を分離するために使用されました。

EDIT:IBM Enterprise COBOLでは、識別子にDBCS文字を使用できます。 Yikes!

+0

FFFTPのような一部のftpツールは、エンコード変換のプリフォームを行うため、転送方法を指定してください。 http://www.forest.impress.co.jp/lib/inet/servernt/ftp/ffftp.html – monkut

+0

もしそうなら、そのデフォルトは何ですか? –

+0

注CP-932は、Shift-JISの拡張機能です(Windowsではよく使用されます)。一部の文字が正しくエンコードされないため、平均CP-932のときはShift-JISを使用しないでください。 –

答えて

2

EUC-JP、ISO-2022-JP、およびShift-JISの3つのエンコーディングは、日本でまだ非常に多く使用されています。

通常、電子メールにはISO-2022-JPが使用されます。あなたはUnixマシンでEUC-JPを見ることができます。私は個人的にShift-JIS以外のものは扱っていません。

+0

あなたは私が信じていないと思っていることを明言するためにうなずいています: - { –

+0

FULLWIDTH文字を含む複雑な問題について私の元の質問の編集を参照してください。 –

関連する問題