ワード文書からページ数を取得する必要があります。私は多くのライブラリとスクリプト(Apache poi、perlスクリプト、Linux用アプリケーションなど)をテストしましたが、唯一の解決策はMicrosoft OfficeをWineとともにインストールし、OLEにperlでアクセスすることでした。私はそれをすることができましたが、それはライセンスの問題のためにサーバー上で使用することはできないようです...プログラムで、Linux上のMicrosoft Word文書のページ数を取得する
word文書情報へのアクセスを提供するapachepoiおよびその他のソリューションの問題は、いくつかのドキュメントの不完全性に関連しています。ドキュメントサマリーのpageCountプロパティが見つからないことがあります(ドキュメントや古いドキュメントとして保存されたodtドキュメントの場合が多い)。
サーバーにMicrosoft Officeをインストールせずに実際にページを集計する方法はありますか(サマリーから情報を取得するだけでなく)
私はvwSummaryを試しました。はい、ドキュメントサマリを使用しています。私はOpenOfficeに言及するのを忘れてしまった。そこにはPythonとJava APIがあり、実際のページ数を得るのはかなり簡単だ。このアプローチの唯一の問題は、OpenOfficeでdocファイルを開くことです。これは、MS Officeで開かれた同じファイルとは異なる場合があります。 –
はい、OpenOfficeが異なる場合があります。 .docの標準はないことを忘れないでください。本当に答えは、答えがないということです。ドキュメントファイルをレンダリングする標準的な方法はないので、ページを数える標準的な方法はありません。 Wordと同じ数のページを取得する必要がある場合は、明らかにWordを使用する必要があります。 –