pdfbox

    -1

    1答えて

    私はWordを使用して設計されたフォームのセットを持っています。私は、これらのフォームをPDFとして埋めて保存する必要があります。そのすべてがプログラマチックにJavaで書かれています。 私は次の可能性探求: Wordの空を - > PDFのAcroForm - > PDFBoxで を埋める言葉はプログラム的に満たされた - > PDF Wordの空に変換します - > XHTML - > Fly

    0

    1答えて

    私は大量のPDF文書を持っており、そこからテキストを抽出する必要があります。抽出されたテキストは、後で処理するために使用します。私は線形アプローチでTesseract APIを使用して小さな文書のサブセットに対してこれを行い、必要な出力を得ました。ただし、多数の文書がある場合、これには非常に時間がかかります。 この問題を解決するためにHadoop環境処理機能(Map-Reduce)とストレージ(H

    0

    1答えて

    pdfboxとjavaの初心者です - ロゴの書式設定などでPDF文字を複製しようとしています。文の中で現在、WordUtils.wrapを使用して段落文字列を追加し、次にbegin.Textなどを解析して表示します(drawStringはこれを選択できません - 私はそれを使用するマルチフォントの情報を探しました)。フィールド値はテキストと長さが異なるため、表示するフォントを検索、分割、変更する

    0

    1答えて

    私はテキストを抽出し、PDF文書のPDFBox APIを使用してExcelに配置する簡単なアプリケーションを開発中です& Excelファイル用のPOIFSFilesystem(HSSFWorkbook)。最近、私は.docファイルからテキストを抽出し、その時にLOGGERの問題に直面していないExcelに置くアプリケーションを開発しました。今回は、いくつかのエラーが発生しました[ I red Ap

    0

    1答えて

    私は、PDPageContentStreamクラスのaddBezier曲線メソッドを使用してクラウドマークアップを作成する機能を実装しました。今、このマークアップをページの注釈として作成して、これらのマークアップを削除できるようにします。私はPDAnnotation.createAnnotationメソッドを使ってカスタムアノテーションを作成しようとしましたが、COSBase変数が必要です。ですか

    0

    1答えて

    のアプリケーション(PDF2SVG)をPDFBox-1.8.8からPDFBox-2.0.6に移行しています。 POMで私は <pdfbox.version>2.0.6</pdfbox.version> <dependencies> <dependency> <groupId>org.apache.pdfbox</groupId> <artifactId>pdf

    0

    1答えて

    私はPDFBoxを使用してPDFを印刷しています。 PrinterJob Sides.DUPLEXでプリンタに送信された場合、一部のプリンタがデュプレックスを印刷しないという問題に直面しました。ただし、これらのプリンタは、準備されたPCLまたはPSファイルを送信すると、両面印刷できます。私はこのようなリンクを見つけたDuplex Printing of PDF document with T&C

    0

    1答えて

    ページのサイズを7.31 x 11に変更しようとすると、そのページのコンテンツの一部がウィンドウから切り取られてしまいます。以下は私の出力文書へのリンクです。 http://www.filedropper.com/mynewdocument 以下はそれはあなたがすることを言ったのです、私のソースコードを、あなたのコンテンツがオフにトリミングされる。もちろん、 import java.awt.pri

    1

    1答えて

    5544ページを含むこの大きな印刷ファイルは、サイズが約36MBです。ファイルはMS Word 2010によって作成され、各レター/文書にテキストとロゴのみが含まれています。 私はそれを5544ファイルに分割し、キーワードに基づいて2770文字にマージします。各手紙は約です。 140〜145kb。 すべての文字を5544ページを含む新しいpdf印刷ファイルにマージすると、ファイルのサイズは396M