2012-01-16 19 views
1

PDFBoxについて聞いたことがありますが、PDF形式をテキストファイル(または単語)に変換するための良いツールがありますか?私に弾丸、番号、タイトル、サブタイトルなどを与える何か?PDFからテキストへの変換のためのオープンソースのJavaライブラリ

あなたが無料ではないものの、本当に良いものを知っているなら、それはまだ関連しています!

ありがとうございました!

答えて

0

私が欲しかったものが見つかりました!

PdfClownは素晴らしいです!あなたはそれを試してみるべきです。それは、テキスト、ブックマークを取得し、そのブックマークにテキストを添付することができます(しかし、それは些細なことではありませんが)。他のライブラリは私にこれをさせてくれませんでした。最も近いものはAdobe's acrobatでしたが、それはとても古くてサポートもありません。

だから私の選択はPdfClownです。

1

Itextを使用しました。正常に動作します。

+0

実際にiTextは良いですが、十分ではありません...テキストに変換することはできますが、タイトル、サブタイトル、箇条書き/番号などは教えていただけません。 – OhadR

0

IcePdfは、私が信じると考えられる1つの選択肢です。

+0

AFAIK、icePDFはテキスト。 PDFを画像にレンダリングすることができます。 – OhadR

+0

製品の説明によると、http://www.icepdf.org/product/overview.html - > PDFコンテンツの抽出 ICEpdfを使用して、PDFドキュメントのメタデータ、テキスト、およびイメージを抽出します。 –

関連する問題