主な仕事がPDF編集です。pdf書式設定
Appleがpdfの編集にapiを提供していないことを理解しています。しかし、私の要件はそうです。
私はpdfファイルの全内容を抽出し、編集後に新しいpdfを作成することを考えました。今私はpdfのテキストを抽出するためにTj演算子を使用して、PDF形式(ヘッダ、フッタ、画像、ハイライト、,,,)を抽出する方法を知る必要があります
演算子は私がpdfファイルの他の情報を抽出するために使用すべきです。
ありがとうございます。
主な仕事がPDF編集です。pdf書式設定
Appleがpdfの編集にapiを提供していないことを理解しています。しかし、私の要件はそうです。
私はpdfファイルの全内容を抽出し、編集後に新しいpdfを作成することを考えました。今私はpdfのテキストを抽出するためにTj演算子を使用して、PDF形式(ヘッダ、フッタ、画像、ハイライト、,,,)を抽出する方法を知る必要があります
演算子は私がpdfファイルの他の情報を抽出するために使用すべきです。
ありがとうございます。
画像はDo演算子を使用してページにペイントされます。そのオペランドは、リソース辞書のイメージ名です。また、Do演算子は、フォームXObjects(自己完結型ベクトルグラフィックス)をペイントします。これらはリソースディクショナリにも格納されます。 image/form XObjectディクショナリのSubtypeキーは、オブジェクトの種類を示します。イメージの場合は「Image」、フォームXObjectの場合は「Form」です。
その他の要素は、プレーンベクターグラフィックスとテキストです。PDFファイルには、スタンドアロンオブジェクトとしてヘッダー、フッター、段落などがありません。ページヘッダの視覚的に見えるものは、PDFファイルの中では、ページの上部に描かれた単なるテキストです。
ハイライトは、半透明の半透明の黄色の長方形(ページ上の他の矩形とは何の違いもありません)または強調表示のアノテーション(これらはページのアノト配列で利用可能です)でもかまいません。
お返事ありがとうございました。ヘッダーがテキストの場合はどうすればいいですか?通常のテキストとヘッダーを区別するにはどうすればいいですか? Tjオペレータはテキスト用です。イメージ用には何を使用しますか? – cancerian
これには厳密な解決策はありません。ヒューリスティックを定義する必要があります。たとえば、ページの上端から20ポイント以内に表示されるすべてのテキストはヘッダーと見なされます。ページの内容を解釈して決定するのはあなた次第です。イメージは "Do"演算子を使用します。 – iPDFdev
ありがとう。どのようにuiwebviewを使ってpdfの内容を編集するのですか? uiwebviewが使用されている場合、同じファイルに保存することは可能です。私の要件は、PDFファイルを編集しています。助言がありますか?? – cancerian