nvidia

    1

    1答えて

    私は、次のコードを経由してCSR形式に変換C00形式の行列を、持っている: status = cusparseXcoo2csr(handle, cooRowIndex, nnz, n, csrRowPtr, CUSPARSE_INDEX_BASE_ZERO); 私はその後、HYB形式にCSR形式から行列を変換したいが、私はどのくらいのメモリを確認していない 行列をHYB形式で割り当て

    4

    1答えて

    CUDAの機能はcudaRuntimeGetVersion()とcudaDriverGetVersion()です(詳細はhereを参照)。私は最初に「8.0」(CUDA 8.0)を、もう1つはNVIDIAのGPUドライバカーネルモジュールを調べてみたものと同じ文字列を私に渡すようなものでした。 modinfo nvidia | grep "^version:" | sed 's/^version:

    0

    1答えて

    export CUDA_VISIBLE_DEVICES=1を使用してGPU ID 1でテンソルフローを実行していますが、nvidia-smiのすべてがうまく見え、pythonプロセスがGPU 1で実行されます。つかいます。 しかし、奇妙なGPU 0(プロセスリスト、メモリ、消費電力、常識に基づいています)は96%の揮発性GPU使用率を示しています。 誰でも知っていますか? +-----------

    -1

    1答えて

    私の現在のNvidiaカードと同等のIntel HDグラフィックスを見つける方法は、仕様を比較するだけです。これにより、ほぼ同様のパフォーマンスが得られます。

    0

    1答えて

    3x3行列と360x360行列の間の行列乗算をしようとしています。小さな行列(3x3)は、大きな行列の最初の(3x3)ブロックなどで操作されます。したがって、私は小さな行列を定数にして、それをより大きな行列にスライドさせたいと思います。 私の小さなマトリックスを共有メモリの一部として保存し、私の大きなマトリックスを3x3に分けてグローバルにすることはできますか? 小さな行列をホストから直接共有する

    -1

    1答えて

    FBOを別の深度バッファとステンシルバッファで作成しようとしています。 NVidia GPUは歴史的にサポートされているパックドデプス/ステンシルしかサポートしていません。 しかし、私はARB_texture_stencil8拡張モジュールを見つけて、FBOに対してどのように使用するのだろうかと思いました。 このコードglFramebufferTexture2DEXT(GL_FRAMEBUFFER

    3

    1答えて

    ユーザは、デュアルGPUシステム上でIntel GPU上で動作する私のアプリケーション(Direct3D 11を使用してCADライクな機能のために重い3Dコンテンツをレンダリングする)に苦情を言いました。 見つけたのはNvOptimusEnablement/AmdPowerXpressRequestHighPerformanceです。しかし、アプリケーションには.NETのフロントエンドがあり、そこ

    17

    1答えて

    私はnvidia-smi -l 1が1秒ごとにGPUを使用することを知っています(以下同様)。しかし、私はVolatile GPU-Utilが実際に意味するものについての説明を感謝します。これは、総SM以上の使用済みSMの数、または占有率などですか? +-------------------------------------------------------------------------

    1

    1答えて

    私はProfessional CUDA C Programmingを読んでいる、とGPUアーキテクチャの概要セクションで: CUDAは32と呼ばれる縦糸のグループ内のスレッドを管理し、実行するための単一命令複数スレッド(SIMT)アーキテクチャを採用しています。ワープ内のすべてのスレッドは、同じ命令を同時に実行します。各スレッドはそれ自身の命令アドレスカウンタとレジスタ状態を持ち、それ自身のデータ