LoginSignup
2
2

More than 5 years have passed since last update.

AMD Opteron Abu-DhabiとLinuxのtransparent hugepage (THP) との相性問題

Last updated at Posted at 2015-09-24

症状

HPCクラスターの計算ノードとして使っているAMD Opteronベースのマシンで、比較的メモリーを消費するソフトウェアを走らせていると、数時間後に一部のコアのloadが100%となり、一部のプロセスがフリーズする現象が起きた。解除にはリブートが必要で、非常にうっとうしいので対処法を調べてみた。

環境

  • CPU: AMD Opteron Abu-Dhabi 6380 x4 (total 64-cores)
  • RAM: 512Gbytes
  • OS: Ubuntu 14.04 LTS (GNU/Linux 3.13.0-24-generic x86_64)

対処

# echo never > /sys/kernel/mm/transparent_hugepage/enabled
# echo never > /sys/kernel/mm/transparent_hugepage/defrag

これによりtransparent hugepage (THP)サポートを一時的に停止することができるらしい。実行した結果とりあえず問題は起きないようになった。これ以上の原因追及は行っていないが、上記環境とTHPサポートの相性はよろしくないようである。

参考資料

2
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
2