2009-06-16 56 views
41

建物のフロアマップである大きなPDFファイルがあります。それは、座席の場所のテキストボックスを含むすべてのオフィス家具のための層を持っています。phpでpdfファイルを読む

私の目標は、このファイルをPHPで読み込み、ドキュメントでテキストレイヤーを検索し、その内容と座標をファイルで取得することです。このようにして、私は座席位置 - > x/y座標をマップすることができます。

PHPでこれを行う方法はありますか? (またはそれが必要な場合はRubyやPythonでも)

+0

マークアップコードに「座標」が含まれていますか?そうでない場合は、必要なだけ検索することができます。 PHPはPDFファイルのピクセル座標を見つけることができません。 画像などを使用して「問題」を少し詳しく説明してください。 –

+0

こんにちは、あなたの質問に対する答えは見つかりましたか?私はsimillarの問題に立ち向かい、解決策を見つけることができないので...そしてもしあなたが見つけたら、pdfファイルからどのように画像座標を取得したのか教えていただけますか? –

+0

@PigalevPavel申し訳ありませんが、私はしなかった:( –

答えて

27

チェックアウトFPDFは:

http://www.fpdf.org/

http://www.setasign.de/products/pdf-php-solutions/fpdi/

これらは、PDFファイルを開いて、PHPでそれにコンテンツを追加できるようになります。私はあなたが必要とする値の既存のコンテンツを検索するために、その機能を使うこともできると思います。

別の可能なライブラリがTCPDFである:より多くの近代的なライブラリを追加するにはhttp://www.tecnick.com/public/code/cp_dpage.php?aiocp_dp=tcpdf

更新:PDF Parser

+2

phpにpdfを解析する限り、fpdfはpdfparser http: //www.pdfparser.org/documentationはきれいで直感的なプログラミングインターフェイスを持っています – Nate

+2

こんにちは@Nate!私は答えにpdfパーサライブラリを追加しました.6歳の回答のdownvoteに感謝! – Jay

+0

その理由は、ここでは質問はまず第一に範囲外ですが、私は6歳の質問について意見を述べることについて悪いことはないと思っていますが、この場合、下の票は馬鹿ですので、私はあなたを支持しました: ) –

0

Hmm ...正確にはphpではなく、phpからプログラムを呼び出してpdfを一時的なhtmlファイルに変換し、phpで解析することができます。私は私のプロジェクトのために似た何かをやった、これは私が使用したプログラムです。

PdfToHtml

何のプログラムについてのクールだが、それは絶対位置で<のdiv>タグ内のテキスト要素を吐き出すということです座標。これはまさにあなたがやろうとしているようです。 (FPDI付き)

+1

ちょっとあなたの結果を達成するためのサンプルコードを投稿することができますか私は適切なドキュメントを見つけることができませんでしたそれは素晴らしいでしょう – Tarik

0

また、このアプリケーションhttp://pdfbox.apache.org/をしようとする場合があります。実例は

+0

申し訳ありませんが、これはJavaであり、PHPではありません: -/ –

19

にあります。あなたが望むものを正確に実行するPHPライブラリ(pdfparser)があります。

プロジェクトのウェブサイト

http://www.pdfparser.org/

githubの

https://github.com/smalot/pdfparser

デモページ/ API

http://www.pdfparser.org/demo

プロジェクトでpdfparserを含めた後、あなたはそのようmypdf.pdfからすべてのテキストを取得することができます。

<?php 
$parser = new \installpath\PdfParser\Parser(); 
$pdf = $parser->parseFile('mypdf.pdf'); 
$text = $pdf->getText(); 
echo $text;//all text from mypdf.pdf 

?> 

はまねあなたはPDFオブジェクトを取得するようWELとしてPDFファイルからメタデータを取得することができます(例えば、画像の) 。

+0

これは本当に有望です:)ほぼ3年後にありがとうございます! :) –