既存のJava Webアプリケーションに統合する必要があります。これは、2つのpdfドキュメントを比較してその違いを確認できる新しい機能です。そこで、私はこの要求を解決するのに役立つ既存のライブラリやツール(オープンソースまたは商用版)を検索し始めました。 この種のアプリケーションが存在するかどうかは知りませんか?それは2 pdf、それらを比較し、違いを表示するだろうか?事前に2 pdfドキュメントの比較のためのWebベースのアプリケーション
おかげで、
Madalina既存のJava Webアプリケーションに統合する必要があります。これは、2つのpdfドキュメントを比較してその違いを確認できる新しい機能です。そこで、私はこの要求を解決するのに役立つ既存のライブラリやツール(オープンソースまたは商用版)を検索し始めました。 この種のアプリケーションが存在するかどうかは知りませんか?それは2 pdf、それらを比較し、違いを表示するだろうか?事前に2 pdfドキュメントの比較のためのWebベースのアプリケーション
おかげで、
Madalina私の答えは満足ではないかもしれないのですが、Apacheから、このプロジェクトは、 - > http://pdfbox.apache.org/
のuを助けるかもしれません。 pdfをテキストファイルに変換して比較することができます。
こんにちは、私はあなたがlink
使用例は、それが比較の3つの段階で行い下回っあなたは、単にターゲットとソースファイル名を保存することで、ループを追加することができます記載されてからソースコードをdonwloadできPDFBOX上に構築されたPDFの比較ですプロジェクトを作りましたリストを作成し、その比較機能を呼び出します。
pdfComparison cmp=new pdfComparison();
//Text Comparision page by page if(cmp.textComparision("ReferencePDF\\PDF2_302.pdf","C:\\\PDF2_305.pdf"))
{
System.out.print("\n********PDF text is identical******* ");
}
else
{
System.out.print("\n********PDF text is not identical******* ");
}
//Extract all images in PDF and compare
cmp.extract_ALL_Images_ThenCompare("PDF2_302.pdf","PDF2_302.pdf");
//Convert Both PDF pages into JPG and perform image comparison
cmp.PDF_Convert_To_Jpeg_Comparision("PDF2_302.pdf","PDF2_302.pdf");
プロジェクトの差分のすべての画像が表示されます。問題があれば私にメッセージを送ってください
プロジェクトでは現在のPDFBoxリリース1.8.9が使用されています。バージョン2より前のPDFBoxリリースは、PDFページを現在の2.0.0-SNAPSHOTで修正されたイメージとしてレンダリングする際に、多くの欠点を有することが知られています。したがって、PDFBox 1.8.9でのPDF比較の基礎は、最初のスモークテストとして、またはPDFBox 1.8.9が適切にレンダリングできるPDFで非常に制御された環境で動作しますが、一般的なPDFの実動コードでは機能しません。 – mkl
私はPDFボックスを使って比較を行っていません。ただPDFボックスでコンテンツを抽出しています。親切にコードをダウンロードしてください。 – fahad
私の枠組みの中で働いていて、300ページを比較しています。PDF – fahad
このようなツールは存在します。違いは正確に何を意味するのでしょうか?テキストが異なるかどうかを知りたいですか?テキストの書式設定が異なる場合要素(テキストまたはイメージ)が別の場所にある場合イメージのピクセルが異なる場合は?このような場合には、さまざまなアプローチが可能です。 –