2009-04-21 17 views
4

pdfファイルの内容を読んでみたいです。私はLinux上でCでそれをする必要があります。CでPDFを読む

私はこれに近づくほどhereでしたが、春はPDFしか作成できないと思うので、100%は読めません。

PS:私はあなたがそれらを解析する必要がありますするにはどうすればよいだけでなく、PDF

答えて

4

libpopplerをチェックしてください。私はテキストを抽出して仕事をしたことはなく、PDF属性を照会するだけです。使用するのはかなり簡単です。

+0

私はlibpopplerが私が望むものに対しては "大きすぎる"と思っています。私はそれが不要だと思うQTや他のものを使用しています。 –

+0

ポップラーには、glibとQt(オブジェクトシステムにうまく収まるように)のオプションのフロントエンドがありますが、必須ではありません。 – eduffy

+0

私はそれが既にUbuntuリポジトリにあることを知りました。私は見てみましょう。 –

1

からプレーンテキストを必要としますか? 文字列を抽出するだけで、比較的簡単にできます。完全に正確なレンダリングは難しくなります。 evinceやghostscriptのソースを見てみましょうか?

これはC++のためですが、PDF構造​​(前ごめん間違ったリンク)を理解するための良い出発点であるかもしれない

+0

私はpdfファイルから平文が必要です。 –

+0

私はこれがC言語ではうまくいかないと信じています – TStamper

+0

申し訳ありませんが間違ったリンクを貼り付けました - あまりにも多くのウィンドウが開いていました! –

0

私はVersyPDFを使用したことはありませんが、もう1つ可能です。それはあなたがPDFを編集できるようにすると主張しています... http://versypdf.sybrex-systems-ltd.qarchive.org/

+0

Linuxでの作業は必須であることを忘れてしまいました。 –