2012-10-15 20 views
16

私は、ユーザーがMicrosoft Office DocumentファイルをアップロードできるWebアプリケーションで作業しています。現在、私たちのサーバーはExpress.jsでNode.JSを実行しており、我々はHerokuでホストされています。このため、abiwordやcatdocなどのプログラムをインストールすることはできないと思います。ファイルのアップロードは処理できますが、ドキュメントの内容は解析できません。Node.JSのMicrosoft Officeファイルを解析します。

docファイルの内容を読むにはどうすればよいですか?情報はデータベースに格納されます。基本的な書式(太字、斜体、下線)を維持することはいいですが、必須ではありません。

答えて

7

あなたが直接Wordを行いますNPMを得ることができるものがあるように思えませんが、あなたは他のクラウドサービスを経由して、それを要求するためのREST APIを使用することができるかもしれません。たとえば、Saaspose(有名なAsposeツール)はWord,Excel,PDFなどの公開APIを持っています。彼らは自分のページにnode.js、javascript、およびHerokuのサポートを記載しています。

EDIT:npm install officeは答えの少なくとも一部を提供しているようだ:

私はSaasposeが今も似たような主張Aspose for Cloud

別のAPIと呼ばれていることがわかりはDoxument

+0

これは完璧です!どうもありがとうございます。 – arknave

4

Officeパッケージです。私はこれまでExcelのファイルを読むのに使っていますが、これまでWord文書を試していませんでした。

+1

注:このパッケージはunoconv http://dag.wieers.com/home-made/unoconv/(OpenOfficeコンバータ)を実行して入力をHTMLに変換しているようです。 (スプレッドシートの場合はunoconvでxlsに変換し、http://freecode.com/projects/xlhtmlを使用してxls-> htmlに変換する) – Nickolay

+2

およびunoconvでは[libreoffice](http://www.macupdate.com/app/mac/35446/libreoffice)..ウサギの穴はどれくらい深く入りますか?私は、あなたがすべてのサーバーにこれらのアプリケーションをすべてインストールしたいのでなければ、このソリューションが非常にうまくスケールされるとは思わない。これは率直なことではない – abbood

関連する問題