2011-06-30 15 views
3

私はこの質問が何度か尋ねられていることを知っています。そして、私はすべてをチェックしましたが、満足のいく答えを出している人はいませんでした。phpを使ってpdfを解析する

TCPDFが解析することはできますが、私はそのサイトで検索します。 pdfを読むために何も与えられていません。 thn xpdf- xpdfは、サーバーにインストールされ、テキストを抽出するコマンドを実行するユーティリティです。

私はFPDFも検索しましたが、そのサイトでも、pdfやマニュアルの読んだり読んでいるものについては何も読んでいません。

私はテキストを抽出するためにpdfboxとjavaブリッジを使用する必要がありますか?またはtkpdfを使用することが可能であると答える人もいます。

今すぐ好きなもの...?

+0

PDFは基本的にはポストスクリプトコードです。テキストがイメージに埋め込まれていない限り、未加工の追記コードを見て、基本ファイルの入出力と文字列操作を使用してテキストを抽出することができます。 –

答えて

1

私はその状態がほぼ同じだと思います.PDFパーサのPHPネイティブ実装はありません。 command line alternativesがあります。私は他の言語で実装していることを知っています(私は個人的にPythonライブラリを使用します)が、ネイティブPHPのものはありません。

関連する問題