Perlを使用して情報を抽出するには、PDFファイルをテキストに変換する必要があります。しかし、私は、テキストファイルを定位置で取得していないため、PDF内の要素の位置とテキストが同じである必要があります。私はCAM::PDF::PageText
を試しましたが、出力は非常に異なります。PDFからテキストへの位置データの取得方法
私はpdftotextとPopplerを参照している投稿に出くわしましたが、Windows 10の64ビットシステムでこれらの設定はできません。
この問題を解決する他の方法がある場合は、教えてください。
http://stackoverflow.com/questions/6104045/installing-poppler-on-cygwin – xxfelixxx
テキストをテキストエディタにコピーして貼り付けることを検討しましたか? – Borodin
貼り付けデータはコピーできますが、後でテキストファイルから情報を抽出する必要があるため、フォーマットはPDFと似ていません。 – Mohit