2012-02-27 4 views
0

大きなPDFファイルを小さなPDFファイルに分割するには、元のPDFファイルPAGE WISEを分割する方法があります。たとえば、10ページのPDF文書がある場合は、元のPDFファイルを破棄することができますページを分割して10個にファイル化する。これは、ページワイズブレイクよりも小さいPDFファイルを破ることは可能ですか?

しかし、私は、ページの分割よりも小さいPDFファイルを分割する同様の種類のツールを必要としています。つまり、パラグラフ、セクション、要素などの任意のパラメータに基づいてPDFドキュメントを別のドキュメントに分割する必要があります...

例えば

、また
10の段落で2ページを持つ私のPDFファイルは、私は段落のパラメータに基づいて10の別々のPDFファイルにPDFファイルを分割したい場合...

、私は強くPDFはないと考えていますOpen XMLのような構造は含まれていませんが、私は疑いもあります。


どのようにツールは、ページを分割することによって小さなpdfファイルにpdfファイルを分割することができますか?
ページ分割PDFファイルにはどのようなメカニズムが使用されていますか?

私の仕事をする方法はありますか?これに貴重な提案をお願いしますか?

答えて

2

PDFは、ベクターベースの文書記述言語です。それはページベースなので、すべてのページは次のページとは独立しています。したがって、ページを分割することは非常に簡単です。小さな部分集合をpdfで個別に抽出できるラスタ画像とは異なり、小さな部分集合の様子をページ全体に表示する必要があります。

複雑な形状のオブジェクト(ここでは線ですが、テキスト、図形、イメージなど)を含むページ(黒色)があり、サブセット(赤色)を抽出したいとします。関心領域で可視出力を生成するすべてのオブジェクトを最初に見つけなければなりません。次に、それらが正しくレンダリングされるように修正する必要があります(この場合は、オブジェクトの形状を維持しながら青い点から緑の点を計算します)。

Complex shape on a page

簡単なアプローチは、ページ全体を含み、領域の寸法に表示領域をクリップすることであろう。

pdfjamでこれを行うことができます。 --trim/--offset/--deltaコマンドとカスタム用紙サイズ(pdfjamウェブサイトの例6,7)を併用してください。あなたはまだ何らかの形で関心領域の座標を計算しなければならないでしょう。

関連する問題