0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

azureのStandard NC40ads H100 v5 (40 vcpu 数、320 GiB メモリ)にNVIDIA driverを入れてみた

Last updated at Posted at 2024-12-18

azureのStandard NC40ads H100 v5 (40 vcpu 数、320 GiB メモリ)にNVIDIA driverを入れてみたときにnvidia-smiコマンドが

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

エラーを返していたときの対処方法を以下に記載します。

azure protalから仮想マシンを作る

仮想マシンにSSH接続をする

すでに入っているnvidia driverがある場合は削除

sudo apt-get --purge remove nvidia-*
sudo apt-get --purge remove cuda-*

nvidia driverのインストール

ubuntu-drivers devices
  • ここでおすすめされているドライバを次のコマンドでインストールします
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
sudo apt install nvidia-driver-***
  • ***には上のコマンドでおすすめされたドライバの数字を入力してください

再起動

sudo reboot

nvidia-smiで確認

nvidia-smi

以下のようにGPUの情報が返ってくれば成功です。うまく行かなかった場合、下の手順を実行してください。
image.png

secure bootのステータス確認

mokutil --sb-state

もし以下のようにセキュアブートがenabledになっている場合は、disableにします

SecureBoot enabled

azure portalでdisable secure boot

azure portal の VM ページで使用しているVMを選択します。一度停止ボタンを押し、シャットダウンしてください。
設定>構成>セキュリティの種類
のセクションに行くとセキュアブートを有効にするというチェックボックスがあるのでチェックボックスを外します。
image.png
概要ページに戻り起動を押し、SSH接続でもう一度nvidia-smiを確認すると、成功しました。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?