pdf書式設定

主な仕事がPDF編集です。pdf書式設定

Appleがpdfの編集にapiを提供していないことを理解しています。しかし、私の要件はそうです。

私はpdfファイルの全内容を抽出し、編集後に新しいpdfを作成することを考えました。今私はpdfのテキストを抽出するためにTj演算子を使用して、PDF形式（ヘッダ、フッタ、画像、ハイライト、,,,）を抽出する方法を知る必要があります

演算子は私がpdfファイルの他の情報を抽出するために使用すべきです。

ありがとうございます。

2011-08-04 cancerian

画像はDo演算子を使用してページにペイントされます。そのオペランドは、リソース辞書のイメージ名です。また、Do演算子は、フォームXObjects（自己完結型ベクトルグラフィックス）をペイントします。これらはリソースディクショナリにも格納されます。 image/form XObjectディクショナリのSubtypeキーは、オブジェクトの種類を示します。イメージの場合は「Image」、フォームXObjectの場合は「Form」です。
その他の要素は、プレーンベクターグラフィックスとテキストです。PDFファイルには、スタンドアロンオブジェクトとしてヘッダー、フッター、段落などがありません。ページヘッダの視覚的に見えるものは、PDFファイルの中では、ページの上部に描かれた単なるテキストです。
ハイライトは、半透明の半透明の黄色の長方形（ページ上の他の矩形とは何の違いもありません）または強調表示のアノテーション（これらはページのアノト配列で利用可能です）でもかまいません。

出典

2011-08-04 09:00:06 iPDFdev

お返事ありがとうございました。ヘッダーがテキストの場合はどうすればいいですか？通常のテキストとヘッダーを区別するにはどうすればいいですか？ Tjオペレータはテキスト用です。イメージ用には何を使用しますか？ – cancerian

これには厳密な解決策はありません。ヒューリスティックを定義する必要があります。たとえば、ページの上端から20ポイント以内に表示されるすべてのテキストはヘッダーと見なされます。ページの内容を解釈して決定するのはあなた次第です。イメージは "Do"演算子を使用します。 – iPDFdev

ありがとう。どのようにuiwebviewを使ってpdfの内容を編集するのですか？ uiwebviewが使用されている場合、同じファイルに保存することは可能です。私の要件は、PDFファイルを編集しています。助言がありますか？？ – cancerian

答えて

関連する問題