2011-08-15 16 views
0

私はQuark 8.51でコーディングされたpdfを開こうとしていて、文書からテキストを抽出するためにitextを使用していますが、開かれたばかりのばかげたシンボル無意味な言葉。誰にも何か提案はありますか?itext pdf issue

+0

ファイルはhttp://96-38-234-101.static.gwnt.ga.charter.com/Coates.pdf – Eric

+1

からダウンロードできますあなたはテキストを抽出するために使用しましたか? – Milhous

答えて

0

あなたはITextメーリングリストに尋ねたことがありますか、またはjpedalやPdfBoxのような他の抽出ライブラリを試しましたか?

0

プレーンテキスト以外のものを読み込もうとすると、それは動作しません。問題の原因となる可能性のあるものはエンコードです