私はpdfsをテキストファイルに変換しようとしています。 私は、変換を実行するには、このコマンドを使用します。Ghostscriptテキストライターは空白行を残す
gs -dBATCH -dNOPAUSE -sDEVICE=txtwrite -sOutputFile=output.txt input.pdf
Ghostscriptのバージョンは9.07です。
私はPDFで表示されているすべてのテキストを取得します。可能であれば、テキストファイルに空白行を保存したいと思います。あなたはアップグレードすべき
おかげ
通常、PDF *には空白行がありません。 「ライン」の概念さえもかなり広いです - 仕様では、一連のテキストを1行に出力できますが、任意のテキストの「任意の」xとyの位置も許可します。そのような目的のためには、各「線」のy位置を比較し、距離が「空白」として数えられるほど離れているかどうかを判断する必要があります。 – usr2564301