halide

    1

    1答えて

    このコードを実行するためにグレースケールイメージpng形式をロードしようとするとエラーが発生します。私のプログラムは、これが私のコードであるハロゲンチュートリアルレッスン2からの一部です: #include <stdio.h> #include "Halide.h" #include "halide_image_io.h" using namespace Halide

    0

    1答えて

    8x8の各パッチに複雑な操作を適用して、イメージをループしたいと思います。たとえば、各パッチの特異値分解(SVD)を計算し、3番目の特異値を出力画像に格納する必要があるとします。 Halideと組み合わせてライブラリ(例:SVDのLAPACK)を使用することは可能ですか?または、ハライドパイプラインの一部としてSVDアルゴリズムをプログラムする必要がありますか?

    1

    2答えて

    GPUでハライドコードを実行したい。 GPUでの実行方法とクロスコンパイルの方法に関するチュートリアルの例があります。しかし、クロスコンパイルとGPUでの実行を組み合わせたチュートリアルはありません。 私はクロスコンパイルのチュートリアルの方法と同じ方法を試みました。しかし、私はターゲットの設定がわからない。 target.os = Target::Windows; target.arch =

    0

    1答えて

    我々は(手書きOpenCLのコードの部分のため)のように制限* CONSTグローバルとしてそれらを指定したとき、我々は、入力引数のための効率的なハードウェアパスを取得: __kernel void oclConvolveGlobalMem(const global float* restrict input, constant float* restrict filte

    1

    1答えて

    色変換Funcを実装して、3つの別々のバッファに出力しようとしています。 rgb_to_ycocg機能には、4ビット×8ビットのチャネルインターリーブドバッファ(BGRA)と3つの出力バッファ(Y、CoおよびCg)があり、それぞれ16ビットの値です。 void rgb_to_ycocg(const uint8_t *pSrc, int32_t srcStep, int16_t *pDst[3],

    1

    1答えて

    画像Img1の各ピクセルが画像Img2の対応するピクセルを持つ2つの画像間で操作(追加など)を行いたいとします。対応ベクトルはタプルデルタに格納されます。基本的には次のようなものです: Img(x、y)= Img1(x、y)+ Img2(x + Delta [0](x、y)、y + Delta [1](x、y)) ; これはメモリギャザー操作です。ハライドでそのようなパターンを描写する最良の方法は

    0

    1答えて

    ように私は静的ライブラリの両方以下のコードをコンパイルすると、オブジェクトファイルをしようとしない。静的の場合 Halide::Func f("f"); Halide::Var x("x"); f(x) = x; f.gpu_tile(x, 4); f.bound(x, 0, 16); Halide::Target target = Halide::get_target_from_e

    0

    1答えて

    から返されましたFuncを返す関数があり、ImageParamと定義されている入力バッファを設定したいと思います。この種の機能を使用するgithub repoからチュートリアル/テストを見つけることができません。私はジェネレータを使ってAOTでコンパイルし、別のプログラムをそのプログラムにリンクすることができますが、再コンパイルせずに同じインスタンス内で実行する方が速いことは確かです...私は正し