2016-03-24 3 views
0

PDFからHTMLへの変換をパラレル化したいと思います。ファイルレベルではなく、ページレベルまたはオブジェクトレベルです。並列化のための賢明な選択ですか?それがそうなら、それはどのようにすることができますか? GPUでCPUの速度と比較して、速度はかなり高いでしょうか?GPUでPDFからHTMLへの変換をパラレル化する方法は?

+0

ようこそ。申し訳ありませんが、これはトピックではありません。http://stackoverflow.com/help/on-topicを参照してください。 – kebs

+0

最初に順を追って説明しますか? –

+0

あなたは、PDF、HTML、またはGPUの意味を知っていますか? C++でこの質問にタグを付けると、そうでないことが示唆されるためです。 – MSalters

答えて

1

私の最も単純な答えは、実現不可能な場合があります。

基本的にここで最も重要な分類は、問題がタスク並列かデータ並列かどうかです。最初の1つは、おおまかに言えば、いくつかのスレッドが独自のタスクで多かれ少なかれ独立して作業している問題を指しています。 2番目の問題は、多くのスレッドがすべて同じことをしているが、データのさまざまな部分で問題が発生していることを指します。後者は、GPUが優れている問題です。多くのコアがあり、すべてのコアは同じですが、入力データの異なる部分に作用する。

次の問題は、データを移動することです。

GPUプログラミングは芸術であり、それを正しくするのは非常に難しいことです。

質問がありますので、フォーマット変換を並列化できますか?私は以前にいくつかの変換を行っていましたが、並列処理にはほとんど対応できませんでした。

+4

通常、PDFは一連のページとして編成されています。別のページに問題は、各並列タスクも十分に単純でなければならず、「PDFページからHTMLへの変換」は複雑すぎる複雑さです。 – MSalters

+0

実際、変換する文書がたくさんある場合、いくつかの高CPUクラウドインスタンスを活用して、デフォルトCPUで並列にジョブを実行する方が合理的です。間違いなく安くて速い。 – gusto2

+0

メインの段落はhttp://stackoverflow.com/a/22868938からコピーされています – Marco13

関連する問題