2009-08-29 13 views
0

既存のPDFファイルを読み込み、テキストだけでなく、フォント(太字、斜体など)、段落などのフォーマット情報も取得したい...そこにはありますかこれを行うためのコードライブラリは、オープンソースか商用ですか?すべてのフォーマット情報を含む既存のPDFファイルを読む

私はWindows上にあり、C#ライブラリを好んでいますが、C/C++でもかまいません。

+0

どのような言語ですか?環境? –

答えて

1

私は非常に のPDFlib(http://www.pdflib.com/)をお勧めすることができます。 商業用ですが、個人的に無料で使用できるライト版もあります。それは非常にmuach機能を含み、すべてのプラットフォームで利用可能です。

0

私はこれにMeyers氏をエコーし​​ます。それらの数は多いようです。あなたの好きな検索エンジンで "pdf parser library"(あなたの言語に加えて)を検索してください。

いくつかのトップのヒット:

http://www.lowagie.com/iText/

http://metacpan.org/pod/PDF::Parse

http://podofo.sourceforge.net/

http://www.vicman.net/download/13733/(.NETのためのいくつかの)既存のを編集したいしている場合ということ

注意PDFを読むには、

http://1t3xt.info/tutorials/faq.php?branch=faq.pdf_in_general&node=replace_word

+0

ありがとうございましたTrueWill、私は前に検索し、それらのいくつかは、パース時にパワフルではないがPDFを作成する強力な能力を持っていることがわかった、経験豊富な人からいくつかの指導を得ることを望むので、これらすべてのライブラリを評価してください。 –

+0

あなたがお勧めした記事を読んだ後、私はそのようなライブラリがあるかどうかについて悲観的です –

0

Pdfium.Net SDKもお手伝いできます。このAPIを使用すると、テキスト、画像、その他のオブジェクトとそのプロパティのコレクションにアクセスできます。 私はこのAPIを開発した会社で働いています。

関連する問題