2017-08-09 8 views

答えて

-1

あなたの期待によります。

  • テキスト抽出を使用して、特定のページのすべてのテキストを取得できます。どのようにテキストを処理するかはあなた次第です。 (正規表現など)

  • また、文書とテンプレートを一致させるiText7アドオンであるpdf2Dataを使用することもできます。 pdf2Dataは、その出力としてXMLファイルを生成するため、よく適合しているようです。 pdf2Data上

詳しい情報はこちらをhttp://itextpdf.com/itext7/pdf2Data

+0

値は、それが依存 – hrishi

+0

マップできないなどのテキスト抽出はあまり有用ではありません見つけることができます。特定の場所(Rectangle)を入力として使用するTextExtractionStrategiesを使用できます。これにより、よりターゲットを絞ったアプローチが可能になります。特定の(概ね定義された)位置にテキストを配置したら、正規表現を使用して結果をさらに絞り込むことができます。 –

+0

ありがとう、私はそれを確認します。私はPDFに慣れていません。私はiText Javaコードを使ってXFAフォームを読みます。任意のサンプルコードリンクを共有して、プログラムで使用する方法を知ることができます – hrishi

関連する問題