2011-12-19 5 views
1

私はかなり長い間それをしてきましたが、これはpdf2domパーサーで、おそらくthisのリバースエンジニアリングバージョンでした。とにかく、ここに私の質問です。どのレンダリングエンジンであれ、その入力はデータストリーム(私の場合はpdfコンテンツ)であり、その出力は選択されたフォーマット(私の場合はDOM、HTML & CSS)でなければなりません。javascriptを使用したDOM変換へのPDF

  1. しかし、代わりにJavaやC++を使用しての、それは私がサーバーから(私はについては考えているものです)「PDFデータ」のストリームを取得し、JavaScriptの変数との使用に保存することも可能ですjavascriptをレンダリングしてDOMに追加しますか?

  2. 未加工の「pdfデータ」はどのように表示されますか(特定のフォーマットなどありますか?)

すべての入力を歓迎します。

注:はIEと互換性があります。

答えて

5

すでに完了しています。結果はpdf.jsです。 PDFをキャンバス上にレンダリングすることによって動作していることに注意してください。結果はそのように保証されます。 PDFの一部の機能は、現在キャンバスの外では使用できません。

+0

本当にいいですね、このプロジェクトについての手掛かりはありませんでした。 – Graham

+0

申し訳ありません。私の悪い。私はこれに遭遇しましたが、キャンバスは私にとってオプションではありません。つまり、6,7,8もX-Dをサポートしなければならないため、自分でレンダリングする必要があります。私の質問を更新しないでください。 +1これは次のベストです。 –

+1

@Astroth:あなたは[ExplorerCanvas](http://code.google.com/p/explorercanvas/)でそれを使ってみることができます。それは完璧ではないだろうが、おそらく一般的に無理な仕事をするだろうと思う。とにかくキャンバスを使わずに管理できるのと同じくらいうまくいくと思います。 –

2

PDFは、一般に、Flash、JavaScript、およびその他のあらゆる種類の埋め込みのためのPostScript +オプションのサブセットです。

PDFを簡単にHTML(/ DOM)に変換して、それを正しい方法でレンダリングすることは不可能です。例として、PDFはJPEG画像を使用していますが、ここでは微妙な変更があります。つまり、他の場所で使用する前に変換する必要があります。 PDF.js-guysからいくつかのプレゼンテーションを読んでみると、かなり長いWTFのリストが見つかります。

しかし、シンプルなPDF(プレーンテキスト、イメージなど)がなく、レイアウトの中で最も単純なものを保存することは気にしない場合は、PDFから文字列データを切り取ってそれをDOMに挿入します。

個人的には、ユーザーにプラグイン(flash/acrobat/...)を強制するか、PDFのサーバー側をレンダリングしてブラウザにイメージとして提供する方が簡単だと思います。

関連する問題