2016-04-07 10 views
0

私はPostScriptパーサーを書いています。 PDFからPostScriptを取得しています。私は理由がわからないが、時には私のポストスクリプトがちょっとばかげて終わる。PostScriptが「end end」で終わるとは思いますか?

<0053> 
<0072> 
endbfchar 
endcmap CMapName currentdict /CMap defineresource pop end end 
1 
><0Ö 

私の質問です。すべての有効なPostScriptが "end"という単語で終わると仮定することはできますか?

この場合、ファイルの最後に表示されている余分な文字は切り取ることができます。

ありがとうございます!

+0

オブジェクトに含まれているデータだけを読み込んだとしても、このぎこちないことはありますか?それはPDFにも存在しますか? – usr2564301

+2

このようなファイルの例を投稿できますか?有効なPostScriptプログラムが特定のバイトシーケンスで終了することは絶対に想定できません。他の質問は、PDFファイルからPostScriptをどうやって取得しているかです。なぜPostScriptインタプリタが必要なのですか?あなたは、パーサーが十分にうまくいかないことを理解しています。完全なPostScriptを処理するには通訳が必要ですか? – KenS

答えて

0

Np。 "end"で終わる有効なPostScriptストリームは期待できません。さらに、PostScriptストリームの終わりを示す特定のバイトシーケンスはありません。 PostScriptプログラムの終わりに何かがあるかもしれません。たとえば、eexec用にエンコードされたバイナリトークンが発生する可能性があります。