PDFBoxについて聞いたことがありますが、PDF形式をテキストファイル(または単語)に変換するための良いツールがありますか?私に弾丸、番号、タイトル、サブタイトルなどを与える何か?PDFからテキストへの変換のためのオープンソースのJavaライブラリ
あなたが無料ではないものの、本当に良いものを知っているなら、それはまだ関連しています!
ありがとうございました!
PDFBoxについて聞いたことがありますが、PDF形式をテキストファイル(または単語)に変換するための良いツールがありますか?私に弾丸、番号、タイトル、サブタイトルなどを与える何か?PDFからテキストへの変換のためのオープンソースのJavaライブラリ
あなたが無料ではないものの、本当に良いものを知っているなら、それはまだ関連しています!
ありがとうございました!
私が欲しかったものが見つかりました!
PdfClownは素晴らしいです!あなたはそれを試してみるべきです。それは、テキスト、ブックマークを取得し、そのブックマークにテキストを添付することができます(しかし、それは些細なことではありませんが)。他のライブラリは私にこれをさせてくれませんでした。最も近いものはAdobe's acrobatでしたが、それはとても古くてサポートもありません。
だから私の選択はPdfClownです。
Itextを使用しました。正常に動作します。
IcePdfは、私が信じると考えられる1つの選択肢です。
AFAIK、icePDFはテキスト。 PDFを画像にレンダリングすることができます。 – OhadR
製品の説明によると、http://www.icepdf.org/product/overview.html - > PDFコンテンツの抽出 ICEpdfを使用して、PDFドキュメントのメタデータ、テキスト、およびイメージを抽出します。 –
実際にiTextは良いですが、十分ではありません...テキストに変換することはできますが、タイトル、サブタイトル、箇条書き/番号などは教えていただけません。 – OhadR