nvidia

    0

    1答えて

    NVIDIA Collective Communications Library(NCCL)バージョン2の場合、NVIDIAは、インストールファイルにアクセスする前に、最初に開発者として登録するようにユーザーに求めます。 これは、容器にNCCLをインストールする方法に挑戦します。個人用には、DockerfileADDコマンドを使用して、インストールファイルをコンテナにコピーできます。しかし、このア

    1

    1答えて

    Nvidiaウェブサイトでは、MXNetはNCCL(https://developer.nvidia.com/nccl)を使用していると主張しています。しかし、MXNetのgithubリポジトリから実際にNCCLライブラリを使用している参照は見つかりませんでした。チェイナのブログで 、彼らはまた、チェイナが原因チェイナでNCCLライブラリーの使用の4つのGPU上でMXNetよりも優れた性能を達成し

    0

    1答えて

    4x1080tiを使用してトレーニングモデルを終了すると、2つのケースでサーバーがダウンしました。なぜサーバーがクラッシュしたのですか? 私はsysylogを取得し、Nvidia-driverまたはGPUについて何か間違っていることを発見しました。 たsyslog:(及びnvidia-bug-report.log) [第1] 9月6日午後九時11分41秒GPU -8-サーバintesightカーネ

    1

    1答えて

    私は、次のフラグをcmakeの(3.5.1)を使用してソフトウェア(GROMACS 2016.3)をコンパイル: cmake .. -DGMX_BUILD_OWN_FFTW=ON -DREGRESSIONTEST_DOWNLOAD=ON -DGMX_MPI=on -DGMX_GPU=on -DGMX_OPENMP=on -DCUDA_TOOLKIT_ROOT_DIR=/usr/local/cuda

    0

    1答えて

    を開くことができません、私は次のエラーを取得する: 2017-09-24 10:49:20.526121: I tensorflow/core/common_runtime/gpu/gpu_device.cc:955] Found device 0 with properties: name: GeForce GTX 970 major: 5 minor: 2 memoryClockRate

    0

    1答えて

    OpenCLで複雑なアルゴリズムを実装していますが、NVidiaハードウェアの問題に直面しています。私のアルゴリズムが複数回並列に呼び出されると、NVidia GPU上のメモリが不足し、ランダムスレッドの実行がMemoryAllocationエラーで停止する可能性があります(これはhttps://devtalk.nvidia.com/default/topic/1019997/cuda-progr

    0

    1答えて

    でnvidia-smiがエラーを返すkernal 4.10でubuntu 16.04にcudaドライバ8.0とツールキット375をインストールしようとしましたが、このエラーが発生し続けます。 nvidiaドライバとcudaツールキットはどのようにインストールする必要がありますか? > nvidia-smi > NVIDIA-SMI has failed because it couldn't c

    -1

    1答えて

    この質問はWill scikit-learn utilize GPU?に関連していますが、私は同じ答えを提供しているとは思わない。私はNvidia GPUに対してscikit-learnアルゴリズムをエラーなく実行していますので、scikitが基盤となるハードウェア上で動作していると仮定します。 scikit-learnはGPUに対して実行するように設計されていないため、アルゴリズムを実行するプロ

    1

    1答えて

    今日、私はRTFMのtensorflowドットORGは、Linuxをインストール使用してtensorflowインストール、 私はvirtualenvの+のpython3をインストール+ CPUとテストされたテンソルフローHello World、うまくいきました。 次に、VirtualEnv + Python + GPUをインストールするためにnvidiaパス(GPU GTX 970)に進みました。

    0

    1答えて

    が正しく実行され、サーバーのGPUデバイスが正しく表示されます。私はクロックCUDAサンプルを実行しようとすると、しかし、私は次のエラーを取得:../../common/inc/helper_cuda.h:1133コードで CUDAクロックサンプル CUDAエラーを= 30(cudaErrorUnknown) "cudaGetDeviceCount(& device_count)" アイデア?