nvidia

    2

    1答えて

    Volta whitepaperの18ページの表2の末尾にある脚注の意味を知りたいのは興味深かったです。表は、ボルタは前任者と同様SM当たり256キロバイトのレジスタを有することを示すが、フットプリントは、改善されたSIMTモデルの一部を形成する スレッドごとのプログラム・カウンタ(PC)は、典型的に のうちの2つを必要とすることを言及しますスレッドごとにスロットを登録します。 Voltaの実行中

    1

    1答えて

    編集:主な問題は、パッケージインストーラのCUDAツールキットとNVidiaドライババージョンの組み合わせがハードウェアの設定に合わないことが判明しました。 *.run file of CUDAをインストールすると、私はここで説明するようにXubuntuの16.04でtheanoの使用のためにpygpuとlibgpuarrayをインストールしようとしている それを解決: http://deeple

    1

    1答えて

    私は多くのページを見ていて、不明確であるか、 。 私が実行しようとしています: luarocks install https://raw.githubusercontent.com/qassemoquab/stnbhwd/master/stnbhwd-scm-1.rockspec を私はGPUアクセラレーションを使用して、いくつかの画像の上にDenseCapを実行することができるように。私はそれを

    6

    1答えて

    ストリーミング(10ms未満)には非常に短い待ち時間のテクスチャを必要とするプログラムを作成しています。これはストリーミングにはうってつけのGL_ARB_buffer_storageを使用して実装しました。 しかし、ブロックする前にスワップバッファを呼び出すときにNVidiaパイプラインが2〜8フレームをバッファすることを発見しました。これを防ぐ必要があります。私がやっていること は以下の通りです

    0

    1答えて

    CUDAは、アライメントされていないロードとストアをサポートしていますか? addr%k!= 0となるように、アドレスaddrからサイズkバイトの(単一の)値を純粋に読み取ることはできますか? unsigned* p = (unsigned*) ((char *) my_aligned_ptr + 1); *p = 0xAABBCCDD; または unsigned* q = (unsigned

    0

    1答えて

    OpenTKでC#を使用してOpenGL APIにアクセスしています。私のプロジェクトでは、テッセレーションを使用して高さマップを描画しています。私のテッセレーションコントロールシェーダは正方形を64個の四角形のグリッドに分割し、私のテッセレーション評価シェーダはそれらのポイントに垂直方向のオフセットを追加します。垂直方向のオフセットは、このような均一なフロートバッファに格納されています。私は、A

    0

    1答えて

    import tensorflow as tf Traceback (most recent call last): File "/usr/local/lib/python3.5/dist-packages/tensorflow/python/pywrap_tensorflow.py", line 58, in <module> from tensorflow.python.

    -1

    2答えて

    私は完全にcudaで新しく、入力行列、畳み込み(またはフィルタ)と出力行列を与えられた畳み込みを計算するcudaカーネルを作成したいと思います。 注:キューの各スレッドが出力行列の1つの値を計算するようにします。 どうすればいいですか?

    0

    1答えて

    このエラーを修正するにはどうすればよいですか? [[email protected] bin]$ source activate deep_emotion (deep_emotion) [[email protected] bin]$ python Python 3.5.4 | packaged by conda-forge | (default, Nov 4 2017, 10:11:29)

    0

    1答えて

    私はNvidiaのフレックスをエクスポージャーしていますが、私はD3Dの新機能です。私は異なるD3D11_BUFFER_DESCを使用して作成された2つのID3D11Bufferの間でコピーしようとしています。私はID3D11DeviceContext :: CopyResource()をGPU-GPUのコピーだから使ったかったのですが、コードが例外をスローしています。 2つのバッファが以下のよう