2011-02-09 27 views
1

私はいくつかの情報を含む巨大なpdfファイル(20 mb/800ページ)を持っています。Javaから巨大な.pdfファイルを読み込むための最高のAPI

ハイパーリンクのインデックスがあります。また、残りの情報のほとんどは表形式(pdf形式)です。私はJavaを使用してこの情報を取得し、SQL Serverに格納する必要があります。

Javaからこの種のファイルを読み取るのに最適なAPIはどれですか?

+1

iTextは失敗しますか? – Nishant

+0

PDFファイルからテキストを読み込み、DBに保存しようとしていますか? – Madhu

答えて

2

をPDFには含まれていないとして、PDF内の表形式であることはほとんどありません構造情報n作成時に明示的に追加されない限りPDFからのテキスト抽出の問題の一部を説明した記事を書いたhttp://www.jpedal.org/PDFblog/2009/04/pdf-text/

関連する問題