建物のフロアマップである大きなPDFファイルがあります。それは、座席の場所のテキストボックスを含むすべてのオフィス家具のための層を持っています。phpでpdfファイルを読む
私の目標は、このファイルをPHPで読み込み、ドキュメントでテキストレイヤーを検索し、その内容と座標をファイルで取得することです。このようにして、私は座席位置 - > x/y座標をマップすることができます。
PHPでこれを行う方法はありますか? (またはそれが必要な場合はRubyやPythonでも)
建物のフロアマップである大きなPDFファイルがあります。それは、座席の場所のテキストボックスを含むすべてのオフィス家具のための層を持っています。phpでpdfファイルを読む
私の目標は、このファイルをPHPで読み込み、ドキュメントでテキストレイヤーを検索し、その内容と座標をファイルで取得することです。このようにして、私は座席位置 - > x/y座標をマップすることができます。
PHPでこれを行う方法はありますか? (またはそれが必要な場合はRubyやPythonでも)
チェックアウトFPDFは:
http://www.setasign.de/products/pdf-php-solutions/fpdi/
これらは、PDFファイルを開いて、PHPでそれにコンテンツを追加できるようになります。私はあなたが必要とする値の既存のコンテンツを検索するために、その機能を使うこともできると思います。
別の可能なライブラリがTCPDFである:より多くの近代的なライブラリを追加するにはhttp://www.tecnick.com/public/code/cp_dpage.php?aiocp_dp=tcpdf
更新:PDF Parser
Hmm ...正確にはphpではなく、phpからプログラムを呼び出してpdfを一時的なhtmlファイルに変換し、phpで解析することができます。私は私のプロジェクトのために似た何かをやった、これは私が使用したプログラムです。
何のプログラムについてのクールだが、それは絶対位置で<のdiv>タグ内のテキスト要素を吐き出すということです座標。これはまさにあなたがやろうとしているようです。 (FPDI付き)
ちょっとあなたの結果を達成するためのサンプルコードを投稿することができますか私は適切なドキュメントを見つけることができませんでしたそれは素晴らしいでしょう – Tarik
にあります。あなたが望むものを正確に実行するPHPライブラリ(pdfparser)があります。
プロジェクトのウェブサイト
githubの
https://github.com/smalot/pdfparser
デモページ/ API
プロジェクトでpdfparserを含めた後、あなたはそのようmypdf.pdf
からすべてのテキストを取得することができます。
<?php
$parser = new \installpath\PdfParser\Parser();
$pdf = $parser->parseFile('mypdf.pdf');
$text = $pdf->getText();
echo $text;//all text from mypdf.pdf
?>
はまねあなたはPDFオブジェクトを取得するようWELとしてPDFファイルからメタデータを取得することができます(例えば、画像の) 。
これは本当に有望です:)ほぼ3年後にありがとうございます! :) –
マークアップコードに「座標」が含まれていますか?そうでない場合は、必要なだけ検索することができます。 PHPはPDFファイルのピクセル座標を見つけることができません。 画像などを使用して「問題」を少し詳しく説明してください。 –
こんにちは、あなたの質問に対する答えは見つかりましたか?私はsimillarの問題に立ち向かい、解決策を見つけることができないので...そしてもしあなたが見つけたら、pdfファイルからどのように画像座標を取得したのか教えていただけますか? –
@PigalevPavel申し訳ありませんが、私はしなかった:( –