halide

1熱

1答えて

このコードを実行するためにグレースケールイメージpng形式をロードしようとするとエラーが発生します。私のプログラムは、これが私のコードであるハロゲンチュートリアルレッスン2からの一部です： #include <stdio.h> #include "Halide.h" #include "halide_image_io.h" using namespace Halide

0熱

1答えて

Halideで外部ライブラリを使用することはできますか？

8x8の各パッチに複雑な操作を適用して、イメージをループしたいと思います。たとえば、各パッチの特異値分解（SVD）を計算し、3番目の特異値を出力画像に格納する必要があるとします。 Halideと組み合わせてライブラリ（例：SVDのLAPACK）を使用することは可能ですか？または、ハライドパイプラインの一部としてSVDアルゴリズムをプログラムする必要がありますか？

1熱

2答えて

GPUのハライドクロスコンパイル

GPUでハライドコードを実行したい。 GPUでの実行方法とクロスコンパイルの方法に関するチュートリアルの例があります。しかし、クロスコンパイルとGPUでの実行を組み合わせたチュートリアルはありません。私はクロスコンパイルのチュートリアルの方法と同じ方法を試みました。しかし、私はターゲットの設定がわからない。 target.os = Target::Windows; target.arch =

0熱

1答えて

constグローバルを使用してOpenCLでハライド<type> *引数を制限しますか？ OpenCLので

我々は（手書きOpenCLのコードの部分のため）のように制限* CONSTグローバルとしてそれらを指定したとき、我々は、入力引数のための効率的なハードウェアパスを取得： __kernel void oclConvolveGlobalMem(const global float* restrict input, constant float* restrict filte

1熱

1答えて

RGBからYUV（YCoCg）への色変換

色変換Funcを実装して、3つの別々のバッファに出力しようとしています。 rgb_to_ycocg機能には、4ビット×8ビットのチャネルインターリーブドバッファ（BGRA）と3つの出力バッファ（Y、CoおよびCg）があり、それぞれ16ビットの値です。 void rgb_to_ycocg(const uint8_t *pSrc, int32_t srcStep, int16_t *pDst[3],

1熱

1答えて

効率的なハライドでのメモリアクセスの収集

画像Img1の各ピクセルが画像Img2の対応するピクセルを持つ2つの画像間で操作（追加など）を行いたいとします。対応ベクトルはタプルデルタに格納されます。基本的には次のようなものです： Img（x、y）= Img1（x、y）+ Img2（x + Delta [0]（x、y）、y + Delta [1]（x、y）） ; これはメモリギャザー操作です。ハライドでそのようなパターンを描写する最良の方法は

0熱

1答えて

ハロゲン化物AOTは、静的ライブラリとして正常に動作しますが、共有オブジェクト

ように私は静的ライブラリの両方以下のコードをコンパイルすると、オブジェクトファイルをしようとしない。静的の場合 Halide::Func f("f"); Halide::Var x("x"); f(x) = x; f.gpu_tile(x, 4); f.bound(x, 0, 16); Halide::Target target = Halide::get_target_from_e

0熱

1答えて

Funcの入力設定が関数

から返されましたFuncを返す関数があり、ImageParamと定義されている入力バッファを設定したいと思います。この種の機能を使用するgithub repoからチュートリアル/テストを見つけることができません。私はジェネレータを使ってAOTでコンパイルし、別のプログラムをそのプログラムにリンクすることができますが、再コンパイルせずに同じインスタンス内で実行する方が速いことは確かです...私は正し