私はこの質問が何度か尋ねられていることを知っています。そして、私はすべてをチェックしましたが、満足のいく答えを出している人はいませんでした。phpを使ってpdfを解析する
TCPDFが解析することはできますが、私はそのサイトで検索します。 pdfを読むために何も与えられていません。 thn xpdf- xpdfは、サーバーにインストールされ、テキストを抽出するコマンドを実行するユーティリティです。
私はFPDFも検索しましたが、そのサイトでも、pdfやマニュアルの読んだり読んでいるものについては何も読んでいません。
私はテキストを抽出するためにpdfboxとjavaブリッジを使用する必要がありますか?またはtkpdfを使用することが可能であると答える人もいます。
今すぐ好きなもの...?
PDFは基本的にはポストスクリプトコードです。テキストがイメージに埋め込まれていない限り、未加工の追記コードを見て、基本ファイルの入出力と文字列操作を使用してテキストを抽出することができます。 –