カスタムglBlendFuncはネイティブよりもかなり遅い

私は自分のカスタムglBlendFuncをフラグメントシェーダで作成しようとしていますが、正確なブレンド機能を実行しても、私の解決方法はネイティブのglBlendFuncよりはるかに遅いです。カスタムglBlendFuncはネイティブよりもかなり遅い

、誰もがより効率的な方法でこれを行う方法上の任意の提案を持っていた場合、私は思っていました。「混合操作は、GPUのハードウェアに直接組み込まれているので、あなたはおそらく上がらないので、それは、多くの方が効率的である

void draw(fbo fbos[2], render_item item) 
{ 
    // fbos[0] is the render target 
    // fbos[1] is the previous render target used to read "background" to blend against in shader 
    // Both fbos have exactly the same content, however they need to be different since we can't both read and write to the same texture. The texture we render to needs to have the entire content since we might not draw geometry everywhere. 

    fbos[0]->attach(); // Attach fbo 
    fbos[1]->bind(1); // Bind as texture 1 

    render(item); 

    glCopyTexSubImage2D(...); // copy from fbos[0] to fbos[1], fbos[1] == fbos[0] 
}

fragment.glsl

vec4 blend_color(vec4 fore) 
{ 
    vec4 back = texture2D(background, gl_TexCoord[1].st); // background is read from texture "1" 
    return vec4(mix(back.rgb, fore.rgb, fore.a), back.a + fore.a); 
}

出典

2011-08-14 ronag

あなたの最善の策はNV_texture_barrierです。名前にもかかわらず、AMDも同様に実装しているので、Radeon HDクラスのカードに固執すれば、それを利用できるはずです。

基本的に、それはあなたが結合FBOやテクスチャの添付ファイルの操作などのヘビー級操作をせずに、ピンポンにpingを実行することができます。仕様には、一般的なアルゴリズムを示す下部に向かってのセクションがあります。

もう1つの方法はEXT_shader_image_load_storeです。これにはDX11/GL 4.xクラスのハードウェアが必要です。 OpenGL 4.2は最近、これをARB_shader_image_load_storeでコアにプロモートしました。

ダーシーが言ったように、これでも、あなたは決して規則的なブレンドに勝つことはありません。シェーダがアクセスできない特殊なハードウェア構造を使用します（シェーダの実行後に発生するため）。他の方法では絶対に達成できない効果がある場合にのみ、プログラムによるブレンドを行うべきです。

出典

2011-08-14 03:00:04

NV_texture_barrierを使用すると、同じテクスチャを同時にレンダリングしたり、同じテクスチャから読み込んだりすることができます。 – ronag

@ronag：並べ替え。拡張仕様を読むのが最善ですが、その共通の要点は、同じ場所からそうしていない限り、同じテクスチャを読み書きできることです。そして、障壁を適切に使用すること。 –

：

私のソリューションは、このようなものを作品速度のためにそれを打つことができるようになるでしょう。そう言って、デプステスト、バックフェールカリング、ハードウェアブレンド、その他の不要な操作を無効にしてください。私はそれが大きな違いを生むとは言いませんが、それはいくつかのことをするかもしれません。 FBOベースのブレンドの性能を向上させるための

出典

2011-08-14 02:44:20

カスタムglBlendFuncはネイティブよりもかなり遅い

答えて

関連する問題