CでPDFを読む
答えて
libpopplerをチェックしてください。私はテキストを抽出して仕事をしたことはなく、PDF属性を照会するだけです。使用するのはかなり簡単です。
からプレーンテキストを必要としますか? 文字列を抽出するだけで、比較的簡単にできます。完全に正確なレンダリングは難しくなります。 evinceやghostscriptのソースを見てみましょうか?
これはC++のためですが、PDF構造(前ごめん間違ったリンク)を理解するための良い出発点であるかもしれない
私はpdfファイルから平文が必要です。 –
私はこれがC言語ではうまくいかないと信じています – TStamper
申し訳ありませんが間違ったリンクを貼り付けました - あまりにも多くのウィンドウが開いていました! –
私はVersyPDFを使用したことはありませんが、もう1つ可能です。それはあなたがPDFを編集できるようにすると主張しています... http://versypdf.sybrex-systems-ltd.qarchive.org/
Linuxでの作業は必須であることを忘れてしまいました。 –
私はlibpopplerが私が望むものに対しては "大きすぎる"と思っています。私はそれが不要だと思うQTや他のものを使用しています。 –
ポップラーには、glibとQt(オブジェクトシステムにうまく収まるように)のオプションのフロントエンドがありますが、必須ではありません。 – eduffy
私はそれが既にUbuntuリポジトリにあることを知りました。私は見てみましょう。 –