2012-02-20 5 views
2

テキストを含むpdfファイルのみをHTML形式に変換したいと思います。 内容(テキスト、書式、インデントなど)を取得し、同じ書式、配置、インデントで表示するために変数に格納したいと考えています。PDFをPHPのHTMLライブラリ

誰も私が使用できるPHPクラス/ライブラリ(ソフトウェアツールではなく、インストール不要)を提案できますか?

おかげ

答えて

1

pdf2textは、それが言うまさにあなたを与える:それは、PDFファイルからテキストを抽出し、それがHTMLマークアップに変換しません。このためには、おそらくコマンドラインユーティリティまたはオンラインサービスを使用する必要があります。

Linuxのコマンドラインpdftohtmlツール

Popplerは別のオプションがあります、それは

pdftohtmlと呼ばれるユーティリティが含まれているか、あなたもそこのJavaアプリ

を考慮することがprepredしている場合jPedalがありますこれを行う商用アプリケーションの全範囲が、私はあなたが "無料"を望んでいると推測しています

+0

私はそれらを使用していない、私は彼らの存在を知っているだけなので、実際にどのように良いか、どのように使用するかについてはコメントできません。 –

0

FPDI - PDF-Parser(COMERCIAL)を使用して、 les、FPDI(FREE)をpdfテンプレートのように読み込むことができます(無料版のテキストを変更することはできません)。または、いくつかのHTML形式のテンプレートとショートコードを保存し、TCPDFを使用して新しいpdfを作成することができます:オープンソースPHPクラス。

+0

FPDIはPDFそれを読んでいない。私が欲しいのは、pdfファイルの内容(テキスト)を読み込み、それをphp変数に格納し、pdfと同じ形式(太字、斜体、字下げなど)で表示することです。 –

関連する問題