2012-04-04 15 views
1

既存のJava Webアプリケーションに統合する必要があります。これは、2つのpdfドキュメントを比較してその違いを確認できる新しい機能です。そこで、私はこの要求を解決するのに役立つ既存のライブラリやツール(オープンソースまたは商用版)を検索し始めました。 この種のアプリケーションが存在するかどうかは知りませんか?それは2 pdf、それらを比較し、違いを表示するだろうか?事前に2 pdfドキュメントの比較のためのWebベースのアプリケーション

おかげで、

Madalina
+0

このようなツールは存在します。違いは正確に何を意味するのでしょうか?テキストが異なるかどうかを知りたいですか?テキストの書式設定が異なる場合要素(テキストまたはイメージ)が別の場所にある場合イメージのピクセルが異なる場合は?このような場合には、さまざまなアプローチが可能です。 –

答えて

0

私の答えは満足ではないかもしれないのですが、Apacheから、このプロジェクトは、 - > http://pdfbox.apache.org/

のuを助けるかもしれません。 pdfをテキストファイルに変換して比較することができます。

0

こんにちは、私はあなたがlink

使用例は、それが比較の3つの段階で行い下回っあなたは、単にターゲットとソースファイル名を保存することで、ループを追加することができます記載されてからソースコードをdonwloadできPDFBOX上に構築されたPDFの比較ですプロジェクトを作りましたリストを作成し、その比較機能を呼び出します。

 pdfComparison cmp=new pdfComparison(); 
     //Text Comparision page by page   if(cmp.textComparision("ReferencePDF\\PDF2_302.pdf","C:\\\PDF2_305.pdf")) 
       { 
     System.out.print("\n********PDF text is identical******* "); 

       } 
       else 
       { 
        System.out.print("\n********PDF text is not identical******* "); 

       } 

//Extract all images in PDF and compare 
    cmp.extract_ALL_Images_ThenCompare("PDF2_302.pdf","PDF2_302.pdf"); 

//Convert Both PDF pages into JPG and perform image comparison 
     cmp.PDF_Convert_To_Jpeg_Comparision("PDF2_302.pdf","PDF2_302.pdf"); 

プロジェクトの差分のすべての画像が表示されます。問題があれば私にメッセージを送ってください

+1

プロジェクトでは現在のPDFBoxリリース1.8.9が使用されています。バージョン2より前のPDFBoxリリースは、PDFページを現在の2.0.0-SNAPSHOTで修正されたイメージとしてレンダリングする際に、多くの欠点を有することが知られています。したがって、PDFBox 1.8.9でのPDF比較の基礎は、最初のスモークテストとして、またはPDFBox 1.8.9が適切にレンダリングできるPDFで非常に制御された環境で動作しますが、一般的なPDFの実動コードでは機能しません。 – mkl

+0

私はPDFボックスを使って比較を行っていません。ただPDFボックスでコンテンツを抽出しています。親切にコードをダウンロードしてください。 – fahad

+0

私の枠組みの中で働いていて、300ページを比較しています。PDF – fahad

関連する問題