2016-12-07 16 views
0

私はどのような仕様もせずにファイルを解析しようとしています。このファイルのセクションを変数名に分割する予定ですが、どのようにフィールドが区切られているか分かりません。区切り記号が変わる方法には明らかにパターンがあります。誰かが私を正しい方向に向けることができますか?使用されている区切り文字のタイプは何ですか?

ここで私は(明確にするために私が追加したスペース)に興味があるデータです: GI %がReadCount & IJ を予約

@EEFDAAH TFLBFile CM ExecutionName EL たFileContentsは、 KE vTestB @ CQETMV @ Dmain @Ž¾àÅU

全ファイル(マイナスいくつか目に見えない制御文字):

MFP214DTest 
JA 
BMExecutionNameLFileContents 
BCEAƒSTCF01TFLBFileTestRead0f36c096fa0~1~2~1~2~0~0~0~0~0~0~0~0~0~0~0~0~0~0~TFLBFile~TFLBFile~~0~0~2~0~0~0~0~1~0~0~0~0~0~0~ExecutionName~ExecutionName~0~0~0~0~0~0~0~0~0~0~0~0~0~0~0~1~0~0~0~0~FileContents~FileContents~0~0~0~0~0~0~0~0~0~0~0~0~0~0~0~1~0~0~0~0~0~1~~0~2~'Test'[email protected]@[email protected]cutionNameELFileContentsGI%reservedIJ&[email protected]@[email protected]Ž¾àÅU 
+0

正確なデータを投稿できますか?明確な空白はなく、正確なデータだけです。また、このファイルがどこから来るのかについていくつかのコンテキストを教えてください。また、16進エディタでファイルを調べてみてください。 – Schwern

+0

すべてがテキストですか?改行はありますか? – stark

+0

不可視の制御文字がおそらく重要です。 – mckenzm

答えて

0

あなたが同様に1つのまたは2以上のレコードを掲示し、かつ進していた場合、それは良くなっていることがあります。レコードタイプが異なる場合は、最初にレコードタイプを識別する必要があります。実際には、先頭のフィールドが別々に扱われるように見えます。レコードレベルのヘッダーは、スペースで区切られています。ここに固定数のフィールドがあると仮定してみてください。これが失敗すると、異なるレコードタイプが存在する可能性があり、含まれるデータは、レコードの先頭のマップまたはタイプに条件付きである可能性があります。フィールドは、値のペアとしてargv []要素と同様に任意の順序で読み取ることができます。アーキテクチャは有用な情報でもあり、末尾のバイトは疑いなくバイナリに見えます。

関連する問題