0
gpuノードでクラウドインスタンスを実行しています。私はCUDAをインストールし、nvidia-smiはドライバの詳細、メモリの使用状況を示しました。数日後、私はこのエラーに遭遇します "NVIDIAドライバと通信できなかったためNVIDIA-SMIが失敗しました。最新のNVIDIAドライバがインストールされ、動作していることを確認してください"。NVIDIA-SMIが失敗しました。 Nvidiaドライバと通信できません
最新のドライバ(Tesla M40 Gpus用のNvidia-375.39)をインストールしました。私はまだ同じ問題に直面しています。 の方法がありますか?nvidia-smiがドライバと通信できない理由をデバッグしますか? ii)ドライバが正しく動作しているかどうかを確認します。
ありがとうございます。