2012-01-23 12 views
0

私は、MS Word(および場合によってはWebベースのリッチテキストエディタからの入力)文書を取り込む機能を含むWebアプリケーションを構築しています。これらの文書のformfieldプレースホルダに値を代入し、出力としてPCL文書を生成する。Pythonを使用してWord文書からPCLを出力

私はPythonとWindowsのdjangoで開発していますが、このソリューション全体をWebホスト(まだ選択されていません)に配備する必要があります。実際にはソリューションはLinux上で実行する必要があります。

これが唯一の方法であれば、私はLinux専用のソリューションを公開しています。私は、別の言語で書かれたサーバーと話すことを含むソリューションに触れています。これを行うために必要ならば私はC++またはjavaを書くことができます。最終出力がPCL形式でなければなりません。

私の質問は次のとおりです:pythonを使用してワード文書からPCLを生成するための良いツールチェーンは何ですか?

私はopenofficeに対して何らかのインターフェイスを使用して文書を開き、置き換えを行い、何らかの種類のプリンタドライバに出力を送ることを検討しています。 誰もこの経験がありますか?どのライブラリをお勧めしますか?

私が特定したインタフェースのオプションには、次のものがあります。他の提案は大いに歓迎されるだろう:

第二のアプローチのようなものを使用することですparadocx(https://bitbucket.org/yougov/paradocx/wiki/Home)は、ファイルを開き、Pythonでそれを使って置換を行い、何とかPCLを出力できるものとやり取りします。 このやり方についての経験やコメントがありがとうと思います。

ツールやツールチェーン、アイデアやレシピに関するご意見をお待ちしております。

この質問は同様の地面をカバーしていますが、同じではありません:How to Create PCL file from MS word

答えて

0

私の最終的な解決策は、私のトランスコードを実行するためのJava Webサービスを作成することでした。

  • Docx4j PDFにDOCXを変換するapache FOPにフッククラスorg.docx4j.convert.out.pdf.viaXSLFO.Conversionを提供します。 (FOPは、PCLを出力するので)それは簡単に
  • Sparkは、私はまた、文書を操作するので、私は、Webサービス
  • の私のトランスコーダをラップすることができ、軽量のJava WebフレームワークであるPCLに変換するためにハッキングすることができ、私が持っている必要がありますいくつかのメタデータ、完璧なものはマルチパート形式です。私はそれをデコードするApache Fileupload

ほとんどの場合、私はこれを動作させるために、ライブラリの開発版にアップグレードしなければならなかった。私が使用してのpython側で

  • requestsマルチパートリクエスト
2

GhostscriptがPS(ポストスクリプト)またはPDFを読んで、PCLを作成することができます。 Pythonライブラリを使用することも、サブプロセスだけを使用することもできます。

+0

を準備するために、Webサービス

  • posterと通信するためのおかげで - あなたがインタフェースするためのPythonライブラリを知っていますゴーストスクリプトで、またはpythonでwordをpdfに変換するオプション?もしあなたがそうしたら、あなたがそれらにリンクすることができれば、私は非常に感謝します。 – Marcin

  • +0

    私はsubprocess.Popen()を使用します。コマンドラインの引数はどこかに書かれています... – guettli

    +1

    https://bitbucket.org/htgoebel/python-ghostscript –

    関連する問題