2009-12-10 14 views
12

私はPDFファイル内を検索する方法を探しています。私はPHPのPDFクラスを渡って来たが、私はファイルストリームを読み込み/検索するための関数を見つけることができないようだ。PHPでPDFファイルを検索

だから、私はとナイーブとして、私は)のfile_get_contentsを使用して、ストリーム(取得シンプルにしようとした、明らかにそれは暗号化されたような出力です;)

だから私の質問は、PDFファイルを検索する方法はあります?スクリプト専用/フリー/オープンソースのソリューションを探していて、高価な市販のライブラリを買っていない。

答えて

11

XPDF

ブログ投稿hereがあります。

hereというコードがあります。これは、PDFをプレーンテキストに読み込む単純なクラスです。復号化がサポートされているかどうかは不明です。

PHPドキュメントには、参考になるリソースもいくつかあります。 Click.

FPDFおよびFPDIも役立ちます。おそらくあなたの最善の策をいくつかの研究の後。**

+0

ありがとう、私は明日それをチェックします! +1 – Ben

+0

あなたのすべてのリンクを調べて、上記のクラスが暗号化をサポートしていないことを知りました。ですから、XPMはWindowsマシン上で作業しているので、x:/ xampp/apache/bin/xpdf /ディレクトリにすべてのファイルを置いてxamppがインストールされているので、XPDFは残っているようです。しかし、あなたが送ったblogpostに記載されたコマンドを実行することができません。適切にXPDFをセットアップする方法に関する提案はありますか? (私はウェブサーバーについてそれほど知らない...正しいディレクトリにファイルを置くことさえしたのだろうか?) – Ben

11

はデビッド・ウォルシュによってthis articleを試してみてください。結果テンプレートをカスタマイズして、残りのサイトに合わせることができます(該当する場合)。

+0

私はすぐに読んでみてください!私はあなたの投稿を続けます。 – Ben

2

A PHPの検索エンジンがSphiderがXPDF経由でPDF検索を追加するオプションを持っていると呼ばれる

+0

このオプションでは、引き続き他のライブラリをインストールする必要があります。 "pdftotextとcatdocをダウンロードしてインストールし、conf.phpに場所(パス)を設定してください" – jay

+0

catdocはMS-Officeファイルにのみ必要です。pdftotextはXPDFの一部であり、FAQに "Indexing pdfおよびdocファイル "を参照してください。 – akamike

+0

あなたの答えをありがとう、あなたの努力のために+1を与えましたが、私が探しているものではありません。ありがとう。 – Ben