2011-02-11 9 views
1

私は、XML型のファイルであることを信じているファイルを持っているが、私はTXTに拡張子を変更し、テキストエディタでそれを開いたとき、私はファイルにはどのようなエンコーディングが使用されているのかを判断しますか?

.�2�'��7cõ’¥¶_ä™πUUUN?¯ÖÀuóbåqW÷õxó_i}Ï08Y‚û¡d≈§•§è«/Óÿ`*∆cÅ·x…ëë«Öµ¶fi— 

がされているエンコーディングの種類を決定するためにとにかくあり得ます中古?

EDIT:

ファイルには、法的な堆積ソフトウェアの使用PTXファイルです。私はMac用のリーダーを作成しようとしています。

これは、16進エディタからのファイルの内容です。

1D 2E 01 00 08 32 01 00 27 05 00 00 02 37 63 9B D5 B4 A6 5F 8A AA B9 55 55 55 4E 3F F8 85 CB 75 97 62 03 8C 71 57 D6 9B 78 97 5F 69 7D EC 30 38 59 E2 9E C1 64 C5 A4 A5 A4 8F C7 2F EE D8 60 2A C6 63 81 E1 78 C9 07 91 91 C7 85 B5 A6 DE D1 0D 00 B2 03 99 27 0E 07 E2 3A 22 13 23 0C 4A 14 6C 0A AF 3E 29 53 AA 7E AE C3 3B 01 F6 11 14 27 74 3A C0 D7 D5 D7 22 27 18 55 B7 53 2A 5D 84 5E 3B F7 50 36 07 0C 30 1E F9 D4 FB C1 D7 02 5D 80 F6 85 6D 9C 30 1C 98 B0 C2 74 42 37 8F 76 F0 A4 D7 90 88 09 D1 2A 88 E6 56 BD 41 F5 C3 B2 08 05 8F 15 3B B8 E4 8C 59 2D 12 51 F4 68 7A 15 7A C3 D2 AB 87 68 84 FF 5E 7C 18 D7 21 0F E2 C4 D7 FC 4F B6 1B BC E2 7C 9C 6D FE DA C4 CB E3 60 C3 33 63 74 E6 B7 AB 6A DE B3 9F D2 6E E1 47 51 3B 0B CE EE 6E 21 A1 3C 26 6D A1 59 08 63 93 14 D3 CB 22 F9 E3 A8 E6 9F 8A 69 D7 44 93 4B AE 4D 49 C2 4F 06 7C AD 1D FC 0E C3 B7 CB 75 EB 87 74 84 FE 4F A5 5F 80 9F B3 F4 2A 7B 20 9A 54 73 5E 81 F8 B2 F8 5D 88 D7 8A EB 99 49 2E F7 F0 2B 0C 2F D8 CB 13 D6 21 35 5E 45 F7 53 61 E7 76 8E 5E F5 CB BC 2F 21 F4 8D 91 A3 82 79 A9 DF E0 1B 2E 38 D1 09 C9 2C 78 E9 E3 93 91 8D 7F 27 BE F7 45 B6 EA C0 A7 99 89 92 EF 2E 5A 39 AC CD 70 EF 90 9F CF A5 57 AC 55 D8 62 7E 02 D0 67 84 D1 21 29 B0 E9 94 59 7C 96 FE F1 3F 80 3D 9D 42 61 E1 AB 44 3C 55 70 F1 87 BB F3 2E BC FE 04 24 F5 11 55 6B 36 5D BE 54 F6 EB 63 B8 88 20 0F 25 4E 7E 50 DA CA E6 F2 E8 60 E9 0A A4 E1 65 C2 DC 05 D1 4C FB CB 2D 28 79 91 B3 87 75 93 8E B3 43 69 C7 35 73 E3 3E B5 CD 4B 62 B6 F8 5B 2D A9 B3 73 4F 4C 78 8B AC 3C C0 21 5B 97 45 E3 A8 57 2A D4 D3 70 7E 22 9A 27 63 28 0F 38 6C 67 B2 29 A6 42 83 AD 15 DE CE 5E 95 CA 2F 48 CD F9 9A E6 C6 D0 F4 06 96 62 F8 98 58 ED 43 27 B9 9A DB 4B 21 69 6B CB A6 58 F8 09 C5 31 07 A4 3D F9 CD 4C C9 CB 6F 64 8E AA 15 0D 39 27 5B 2E 7C 2D 5B 0F 55 54 AB D7 57 0D 10 CC AA FC 87 D0 FF 7C 01 05 00 00 02 5E 63 BB D1 A6 A6 5F E5 55 51 55 55 55 77 8F FF 1A 92 50 86 CC D9 C6 DE 2A DB 52 DD 29 78 97 BA AC DB C2 CE 03 80 E8 87 52 53 AE 66 F8 
+0

オペレーティングシステムとファイル拡張子は何ですか? – Wige

+0

これはxmlファイルであるべきだと思いますか?また、ファイルがバイナリであるため、ファイルの先頭をテキストではなく16進数で書き込むことができます。 – CodesInChaos

+0

私はWindows XPとOS X 10を持っています。6とファイルの拡張子はPTX – Ben

答えて

1

一般的な文字セットのようには見えません。ほぼすべてのエンコーディングは、ある形式でASCII文字を保持します。

だから私はいくつかの可能性を参照してください。それはそれだバイナリファイル形式

  • 暗号化されたテキスト/ xmlファイル内のファイル
  • 圧縮テキスト/ xmlファイルに

    1. ファイルを難読化された

    これを見ると、「UUU」や「ëë」のような文字が繰り返し表示されることがよくあります。暗号化されたデータは完全にランダムに見えるので、2番目のオプションはありそうにありません。

    あなたはこれがxmlファイルであるべきだと思いますか?また、ファイルがバイナリであるため、ファイルの先頭をテキストではなく16進数で書き込むことができます。

    あなたのhex-dumpを見ると、私は暗号化されていないと確信しています。 "01 00"のようなシーケンスは、圧縮されていないバイナリ形式では一般的です。それは私の最高の推測です。


    単なるサンプルファイルからパーサーを書くのは難しいです。最初にしようとしているのは、ネット上でフォーマット指定を探していることです。

    ファイル形式を理解しようとすると、アプリケーションを逆順に作成することができます(プログラムがアセンブリにコンパイルされた場合はむしろ難しく、javaや.netなどのバイトコードでは簡単です)。

    または、単純なファイルから始めます。プログラムの変更を最小限に抑え、ファイルの違いを比較してください。これは多くの作業であり、単純なファイル形式でのみ可能です。


    ビット検索時に仕様が見つかりませんでした。そして、実装が1つしかないようです。あなたはそれを作った会社に連絡することができますが、私は何とか彼らが助けてくれるのか疑問です。だから私は自分自身でフォーマットをリバースエンジニアリングする必要があると思います。これはおそらく簡単ではなく、かなりの作業です。良い見た目。

    +0

    どのような暗号化が使用されているかを調べる方法はありますか?それ? – Ben

    +0

    @Benバイトの頻度は、ファイルが暗号化されていないことを示します。 – CodesInChaos

    関連する問題