現在、テキストドキュメントをpdfに変換してブラウザに表示しているため、フォントを保持できないようです。フォントはcourierですが、pdfに変換されるときには何かに変換されます。デフォルトフォントをそのまま使用する簡単な方法はありますか?または、少なくとも変換後にそれを設定できるでしょうか?ここにコードがあります。 public void downloadFile(HttpServletRes
Link to pdf を使用してPDFから目に見えないテキストを削除し、私は上記のPDFファイルからテキストを抽出しようとすると、私が見えた示すビューアーで見えなかったテキストの混合物と同様にテキストを取得します。さらに、所望のテキストの中には、「FALCONS」の「S」や多くの「1/2」文字が欠けているなど、視聴者に欠けていない文字が欠落しているものがあります。これは見えないテキストからの干渉
PDFBOXに問題があります。 だから私は、簡単なコード作成:コメント欄の下のコードが正しくdoesntの仕事「/フィールドを埋める」だから、なぜ私を教えてください public class DelegationsPdf{
public Delegations getPDF(Delegations delegations) throws IOException{
PDDocument
大きなPDF(20,000+ページ)のすべてのページをレビューし、そのページに特定の文字列が含まれている場合は、そのページを別のPDFに変換します。 Exception in thread "main" java.lang.OutofMemoryError: Java heap space
at java.utils.Arrays.copyOf (Unknown Source)
at java