arrayfire

    2

    1答えて

    カラムメジャーフォーマットのアレイファイアアレイに対して線形化されたSTLペンダントであるstl::array<float, 24> fooがあるとします。 af::array bar = af::array(4,3,2, 1, f32);。だから私はオブジェクトdimsとbarの寸法を持って、私は最大4 af::seq - オブジェクトを持って、私は線形化された配列fooを持っています。 foo

    1

    1答えて

    私はarray fireのドキュメントから、ホストポインタから配列fire配列を作成できることを読んでいます。 double * host_data; //do stuff with host_data af::array array(nrows, ncols, host_data); //suppose is a nrows by ncols array ような何かはしかし、それは、配列

    1

    1答えて

    マルチGPUプログラミングでは、arrayFire python(https://github.com/arrayfire/arrayfire-python)を使用しようとしています。 しかし、私はそれを同時に先物(https://docs.python.org/3/library/concurrent.futures.html)ライブラリとインターフェイスしようとすると、同期の問題が発生します。

    1

    1答えて

    私はOpenCLをよく知らないけど、C/C++ APIではOpenCLコードを文字列として提供する必要があります。しかし最近、私はArrayFireライブラリを発見しました。このライブラリは、いくつかの計算を呼び出すために文字列コードを必要としません。私はそれがどのように機能しているのだろうと思った(オープンソースだが、コードはちょっと混乱している)。 template <typename F>

    0

    1答えて

    単純なarrayfireコンストラクタを呼び出すことからSegmentation Faultが発生します。 #include <arrayfire.h> int main(){ af_array a; int N = 10; dim_t dims = 10; af_randu(&a, N, &dims, f32); af::array b(a);

    0

    1答えて

    ArrayFire(3.3.1)の最新リリースをダウンロードしてビルドしようとしています。私はcmake .で立ち往生しています。私はそれをreran、行方不明のライブラリの束をインストールし、そして今、私が取得: -- Could NOT find LAPACK (missing: LAPACK_LIBRARIES) CMake Warning at src/backend/opencl/CM

    2

    1答えて

    私は、GPU(OpenCL)の助けを借りてC++コードを高速化するためにarrayfireを使用します。私はaf :: arrayの600MB以上を持っています。これは列の次元に沿って反転し、それを転置する必要があります。 これまでのところ、私はこれらの操作をC++ルーチンを使って行っていました。私はAFでそれをやりたいのですが、AFライブラリの過度のメモリ使用に気付きました。 1)300MBのア

    2

    1答えて

    ArrayFireで配列を飽和しようとしています。私は、0.75より大きいすべての値を1.0に飽和させ、0.25未満を0.0に飽和させたい。私は次の式を使用しています。 a(a > 0.75) = 1.0; a(a < 0.25) = 0.0; これはaf ::配列型です。それはしばらくの間動作しますが、0.75より大きい値がない配列を取得するとすぐに、次の例外が発生します。 termina

    1

    2答えて

    私は通常、ArrayFireを使用するときにOpenCLバックエンドを使用します。私はi7 CPUでIntel OpenCLを使用していました。私がAF_BACKEND_CPUバックエンドに切り替えたとき、私のコードは約10-15倍遅かったです。私はそれが1つのコアでのみ実行されていることを確認し、気づいた。また、私のプロセッサは4つのコアしかないので、残りの減速を説明するのはSSEまたはAVX命

    2

    1答えて

    http://www.deeplearningbook.org/contents/convnets.htmlの式9.12を変更して、MxN畳み込みカーネルを中央に配置しました。 1入力1つの出力チャネルを仮定すると、勾配のために、以下の式(今の信仰でそれを取る)を与える (簡単にするため): dK(krow, kcol) = sum(G(row, col) * V(row+krow-M/2, co