0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

メモリ相性とGPU処理で意図せぬシャットダウン

Last updated at Posted at 2024-09-30

技術メモというよりは備忘録に近いトラブルシュートです

System unexpected shutdown due to memory combination

English brief comment

Trouble shooting

System

  • B550 / Ryzen5 3500
  • RTX-3060
  • 48MB memory DDR4 PC3200 similar brand
  • Ubuntu 22.04LTS

Synptom

  • Unexpected shutdown due to working AI script with GPU
  • no log was recorded

Failure cause

  • replace other brand memory which is similar spec

Resolution

  • reinstall original memory set
  • After GPU working is no problem

If you cannot find any error, plz remeber what you did!

環境概要

  • B550 / Ryzen5 3500
  • RTX-3060
  • 48MB memory DDR4 PC3200 同一メーカ

トラブル発生

  1. メモリを8GBから別メーカの16GBx2に差し替え(PC3200)
  2. UEFIでの認識、Ubntu22.04起動は問題なし
  3. とりあえずStable-diffusion実行
  4. 画像生成が始まると予告なしのシャットダウン
  5. Object Detectionでも突然シャットダウン

ログは残っていない

  • CPUのみ使用スクリプトでは問題なく完走
  • nvidia-smiを叩いても表示上問題なし
  • CUDAのバージョンも問題なさそう
  • ログを残すよう負荷をかけるが何も残らず

どうも少量のGPUメモリ使用なら問題なし

  • 以前、GPUのVRAMの不良で負荷を2GB程度使うとコケたけどシャットダウンまではなかった
  • 今回はちょっと雰囲気が違いますな。でも500MB程度の軽めのものなら動作しました

基本に立ち返る

  • 現場100回ってことで、メモリをもとに戻す
    普通に動く!

結論

メインメモリの相性問題がGPU処理に影響出ることもあるのね

Appendix

  • こんなもので切り分けしていました
  • ツール作るまでもなかったというオチです
0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?