ECCメモリ(Error-correcting code memory)のエラー発生頻度
エラー発生頻度情報1
https://japan.cnet.com/article/20401367/2/
の記事から引用
以前の研究では、例えば300台規模のコンピュータクラスタからのデータで、メモリモジュールでの訂正可能なエラーの発生率が、稼働時間10億時間当たり200回から5000回であることが示されていた。しかしGoogleは、10億時間当たりのエラーが2万5000回から7万5000回と、発生率がはるかに高いことを発見した。
⇒ 「メモリモジュールでの」の単位がちょっとわからないので、自分のPCでどの頻度かが、ちょっと、わからない。
エラー発生頻度情報2
https://ja.wikipedia.org/wiki/ECC%E3%83%A1%E3%83%A2%E3%83%AA
の記事から引用すると
実際に観測されたエラー発生率は小規模な研究よりも数桁高く、1メガビットあたり10億時間ごとに 25,000〜70,000回だった (およそ 2.5〜7 × 10−11 エラー/ビット・時、つまり8ギガバイトのRAMで1時間に5ビットのエラー)。 毎年8%以上の DIMM がエラーの影響を受けていた。
⇒結論:8ギガバイトのRAMで1時間に5ビットのエラー
ECCメモリ(Error-correcting code memory)のエラーに対する対処
ちょっとおもしろい記事
https://japan.cnet.com/article/20401367/2/
の以下の部分を引用する。
メモリエラーは深刻な問題を引き起こすことがあるが、PCではサーバよりも深刻度がずっと低いと、Glaskowsky氏は述べている。その理由は、サーバはメモリに多くのデータを保存して、それを比較的安全な保管場所であるハードドライブに定期的に書き込んでいるのに対し、PCのメモリのほとんどは、アプリケーションやOSのファイル、あるいは表示されるが編集されない内容しか保存していないためだ。
⇒意訳になるが、PCで、そもそも、大したことしてないでしょ! ちょっと、表示とかさせてるぐらいでしょ と読める。(使用メモリ量の観点からは、傾聴に値する!)
ECCで治せないエラーも知りたい
中性子によるFlashへの影響とかも知りたい
2021年の今の状況も知りたい
なんで、1ビットエラーになるのか?そのサイズ感
あとがき
特になし。
普通のエンジニアとしては、メモリでエラーが発生すると言われると、少し、混乱する!
この記事は、下記はじめです。