pdfbox

    2

    1答えて

    私はPDFBOXで大きな問題に直面しています:私は10Mバイト(test.pdfという)のファイルをロードしようとしたと私はJVM上でそれをロードするために400 MBが必要:ここ コードサンプルです: final File mainFile = new File( "C:/test.pdf"); System.out.println("File size: " + main

    7

    3答えて

    私は、既存のPDF文書内の画像を挿入することですが、問題は、 画像がページの下部に配置され、 ページが新しく追加されたテキストが白になっていますそれを示しています。 私は次のコードを使用しています。 List<PDPage> pages = pdDoc.getDocumentCatalog().getAllPages(); if(pages.size()>0){ PDJpeg img =

    21

    7答えて

    pdfを使用して画像をpdfから抽出しようとしています。例pdf here しかし、私は空白の画像しか得ていません。 私がしようとしてmのコード: - public static void main(String[] args) { PDFImageExtract obj = new PDFImageExtract(); try { obj.read_pdf();

    2

    2答えて

    座標に問題があります。 PDFTextStripperByArea領域が強すぎるように見えます。 次の例の抜粋を考えてみる: ... PDPage page = (PDPage) allPages.get(0); PDFTextStripperByArea stripper = new PDFTextStripperByArea(); // define region for extrac

    4

    1答えて

    私はこれを行う方法が見つかりません。私が必要とするものは、背景として1ページ、前景としてもう1枚です。

    6

    1答えて

    Apache PDFBoxを使用してブックマークで定義された階層を持つPDFドキュメントを読み込みます。階層は木の形であり、内容はリーフレベルのみです。代わりに、ページ全体で Stripper.setStartBookmark(), Stripper.setEndBookmark(), Stripper.writeText()), 戻り値のテキスト:以下のコードを使用して2つのリーフレベル

    -2

    1答えて

    Javaを使用して、選択したテキストのページ番号、行番号および開始列/終了列を検索したい。だから私はこれを行うことができる任意のAPIを使用していますか?

    14

    2答えて

    リンクでPDFファイルをダウンロードするにはどうすればよいですか? 私はJSFを使用してWebアプリケーションを構築していますが、ユーザーが[PDFで保存]リンクをクリックするとPDFをダウンロードできるようになります。 これまでのところ、PDFファイルを生成する作業コードがありますが、そのファイルはデスクトップに保存されています。ユーザーがリンクをクリックすると、pdfファイルをダウンロードする

    0

    1答えて

    から画像を含む、テキストまたはHTMLにPDFに変換します。私は非常にうまく動作するPDFBoxを見つけました。私は片面にPDFのテキストやHTML、その他の画像を取得しました。 しかし、私は少しさらに行きたい、私は、生成されたHTMLをPDFに画像が含まれていなければなりません。 PDFBoxで対応できますか?どうやって? これを行うもう1つのフリーライブラリ機能が分かっている場合は、教えてくだ

    2

    2答えて

    PdfBox-1.6.0.jarを使用して、PDFからIMAGE(.png)への変換を実行しています。 私はWindowsプラットフォームで開発していますが、Linux(Red Hat Enterprise)サーバーにRESTfulサービスとしてソフトウェアを展開しています。 Windowsの適切な文字間隔(pdfと比較して)とは対照的に、コードがLinuxで実行されるときに、文字間隔の差(増加)