0
PDFパーサー(http://www.pdfparser.org/)をインストールしました。私は彼らのウェブサイトをチェックし、デモを使いました。これは私が望む結果をもたらしました。数時間の作曲家の使い方を調べた結果、私は最終的にそれを動作させることができました。今私はデモから結果を得る方法について次の問題に悩まされています。「Smalot PDF Parser」の結果:同じ行にないテキスト
私はドキュメンテーションページのサンプルコードを使用しました。テキストを抽出しましたが、すべてのテキストが同じ行にあります。デモを使用すると、新しいページがすべて新しい段落で開始され、すべてのテキストが区切られた行に配置されました。コード:
<?php
// Include Composer autoloader if not already done.
include 'vendor/autoload.php';
// Parse pdf file and build necessary objects.
$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile('document.pdf');
// Retrieve all pages from the pdf file.
$pages = $pdf->getPages();
// Loop over each page to extract text.
foreach ($pages as $page) {
echo $page->getText();
}
?>
私が上記のコードを使用したとき、私はすべてのテキストを1行に収めました。私の質問は、デモページのスクリプトと同じ結果を得るにはどうすればいいですか?