2
私はpdfファイルを解析し、そこからいくつかのコンテンツを抽出したいと思っています。誰も特定のperlモジュールをリストアップしてもらえますか?CPAN PDFファイルを解析するためのPerlモジュール
ありがとうございました。
私はpdfファイルを解析し、そこからいくつかのコンテンツを抽出したいと思っています。誰も特定のperlモジュールをリストアップしてもらえますか?CPAN PDFファイルを解析するためのPerlモジュール
ありがとうございました。
あなたは、ドキュメントからテキストを解析しようとしている場合、それは実用的ではないかもしれない
または
を見てみてください。 CAM :: PDF :: Textから
何テキスト を推測しようとするいくつかのヒューリスティックを使用していますこのモジュールは、PDFページから順次テキストを抽出しようとします。この は、PDFテキストが任意の順序で にグラフィカルにレイアウトされているため、堅牢なプロセスではありません。このモジュールは、他のどのようなテキストの隣になりますが、簡単にだまされても、 が言う、添字、非水平テキスト、フォントの変更、フォームフィールド など