私はpdfbox-1.8.12を使用してXFAを取得するためにPDFからコンテンツを読み込みます。 ほとんどのファイルでXFAを取得できましたが、フィールド値を忘れることはありませんでした。XFAに入力フィールドがありませんか?
error.pdfのようないくつかのファイルで問題が発生しています。フィールドの多くにCINのような値はありませんが、PDFビューアでファイルを開くと、フィールドやフィールドが表示されます。
public static byte[] getParsableXFAForm(File file) {
if (file == null)
return null;
PDDocument doc;
PDDocumentCatalog catalog;
PDAcroForm acroForm;
PDXFA xfa;
try {
doc = PDDocument.load(file);
catalog = doc.getDocumentCatalog();
acroForm = catalog.getAcroForm();
xfa = acroForm.getXFA();
byte[] xfaBytes = xfa.getBytes();
doc.close();
return xfaBytes;
} catch (IOException e) {
// handle IOException
// happens when the file is corrupt.
System.out.println("IOException");
return null;
}
}
次に、[]はStringに変換されます。
Thisはこのファイルのxfaです。このファイルで 'U72300DL1996PLC075672'を検索すると、ファイルが見つかりません。
これはすべてのフィールドを示すnormalファイルです。
すべてのアイデア?私はすべてを試しましたが、私の推測では、読者はその価値を見ることができるので、私は同様にできるはずです。
編集: ファイルをダウンロードする必要があります。ブラウザで表示できない場合があります。
私は十分にありがとうございます。私は可能な限りすべてのことを試していたが、それは解析の誤りだと思った。代わりにファイルを保存してから解析していました。再度、感謝します!!乾杯!! – Mayank