SAは、冶金額におけるやきなましから着想を得た軌跡ベースのメタヒューリスティックス手法であり、多くの組み合わせ最適化問題を解くために適応され、一般的な問題から特化したものまで、長年にわたって改良・変形されてきた。
実現可能な初期解 x0 がランダムに生成され、各反復iにおいて、その反復で検討された解xiの近傍N(xi)から新しい(yi)がランダムに生成される。
新しい解が現在の解よりも優れている場合、アルゴリズムはその解に移動する。そうでなければ、悪い解に移行する確率が与えられている。
より悪い解を受け入れることで、最適な解をより広く探索することができ、初期の反復において局所最適に陥ることを避けることができる。
要は、今、探している解が局所解かもしれず、もしかしたら、もっとよい解があるかもしれない。そこを判断するパラメーター(近傍:といいます。近傍は、別途、説明します。)がある確率変数で決定されます。一旦、悪い解を受け入れるとは、山登りの谷を想像すると分かるように、一旦、山を降らないと、一番高い山(を目指すことをゴールとしています)に行けないというイメージです。
このメタヒューリスティクス(ちなみに、東工大のAIのクラスで、AIと数理モデルの合いの子、中間みたいイメージだと教えてもらいました)は、とても人間が考える手段と似ています。
今、このSAを開発中です。