XFAフォームを持たないPDFドキュメントからデータを読み取る

iTextを使用して、XFAフォームを含むPDFドキュメントを読み込みます。私はそれをXMLに変換し、XMLからデータを読み込んでデータベースに挿入します。 PDFでXFAフォームを使用していないと、PDFからデータを効率的に読み取る方法は？XFAフォームを持たないPDFドキュメントからデータを読み取る

出典

2017-08-09 hrishi

-1

あなたの期待によります。

テキスト抽出を使用して、特定のページのすべてのテキストを取得できます。どのようにテキストを処理するかはあなた次第です。（正規表現など）
また、文書とテンプレートを一致させるiText7アドオンであるpdf2Dataを使用することもできます。 pdf2Dataは、その出力としてXMLファイルを生成するため、よく適合しているようです。 pdf2Data上

詳しい情報はこちらをhttp://itextpdf.com/itext7/pdf2Data

出典

2017-08-09 09:06:57

値は、それが依存 – hrishi

マップできないなどのテキスト抽出はあまり有用ではありません見つけることができます。特定の場所（Rectangle）を入力として使用するTextExtractionStrategiesを使用できます。これにより、よりターゲットを絞ったアプローチが可能になります。特定の（概ね定義された）位置にテキストを配置したら、正規表現を使用して結果をさらに絞り込むことができます。 –

ありがとう、私はそれを確認します。私はPDFに慣れていません。私はiText Javaコードを使ってXFAフォームを読みます。任意のサンプルコードリンクを共有して、プログラムで使用する方法を知ることができます – hrishi

XFAフォームを持たないPDFドキュメントからデータを読み取る

答えて

関連する問題