ノード用のインポートルーチンを使用していますが、pdf2jsonを使用してPDFからテキストノードをインポートすることはできますが、これはうまく動作しますが、PDFでは動作しませんテキストを含んでいません。node.jsにある既存のPDFファイルをインポートする方法
だから私はpdf2imgをダウンロードし、しかし、このモジュールの問題の多くがあり、私が今持っている一つは、それを実行した後に、私が作成した0バイトのPNGファイル、コンテンツのない、エラーメッセージの多くを得ることです:
/docfire/node_modules/gm/lib/command.js:228
proc.stdin.once('error', cb);
^
TypeError: Cannot read property 'once' of undefined
at gm._spawn (/docfire/node_modules/gm/lib/command.js:228:15)
at /docfire/node_modules/gm/lib/command.js:140:19
at series (/docfire/node_modules/array-series/index.js:11:36)
at gm._preprocess
convertPdf2Imgでgm.streamで(/docfire/node_modules/gm/lib/command.js:177:5) (/docfire/node_modules/gm/lib/command.js:138:10) ( /docfire/node_modules/pdf2img/lib/pdf2img.js:93:6)/docfire/node_modules/pdf2img/lib/pdf2img.js:67:9 で /docfire/node_modules/async/lib/async.jsで: 246:17 /docf怒り/ node_modules /非同期/ libに/ async.js:122:13 _eachで(/docfire/node_modules/async/lib/async.js:46:13)
私はGITに問題を投稿してみましたモジュールのサイトではありますが、かなりの数の人がまったく同じ問題を抱えているように見えます。また、修正に関するアクティビティもないようです。
私が理想的なのは、ノードのPDFからテキストと画像を抽出する方法です。
私はあなたがPDF-画像NPMパッケージを試すことができ、pdf2img 0.2.0、ノードのバージョン7.8.0でのMacOSシエラv10.12.4 を実行しているのiMacにGM 1.23.0
ありがとう、素晴らしい作品! – SPlatten