More than 3 years have passed since last update.

Pythonで実数値遺伝的アルゴリズムの性能を評価してみる

Last updated at 2021-02-11Posted at 2019-06-23

はじめに

大学時代にニューラルネットの重みを遺伝的アルゴリズムで最適化するという手法の研究をしていました。
ニューラルネットのコードはDeepLearningの流行により大量にサンプルがありますが、遺伝的アルゴリズムはあまりないので、過去にC++で作っていたものをPythonに移植してみました。

[2019/7/12] コードをアップしました。

遺伝的アルゴリズムとは

生物の進化を模倣した最適化手法です。
手法にもよりますが、主な流れは以下のようになります。

複数の個体で構成された集団を作成する。(1つの個体は複数の染色体を持つ。1つの染色体は複数の遺伝子を持つ。(染色体に関しては記載していない参考書もあります。))
任意の評価方法により評価し、各個体の適合度を求める。
集団から任意の個体を選択(選択された個体を親と呼ぶ)し、交叉、淘汰により、子を複数個生成する。
生成した子を評価する。
親と子の中から適合度に基づき選択し、集団と入れ替える(世代交代)。
3.～5.を最大世代数まで繰り返す。

遺伝子はビット列で表現しているものが基本ですが、実数で表現したものが実数値遺伝的アルゴリズム(以下、「実数値GA」)です。ニューラルネットワークの重みは実数なので、重みの最適化に実数値GAが使用できます。

実数値GAに関しては、以下の説明が分かりやすいです。
実数値遺伝的アルゴリズムざっくり説明

実数値GAの手法に関して

実数値GAの手法は、主に世代交代モデルと交叉法に分かれます。

世代交代モデル(子と親の入れ替えルール)：MGG、JGGなど
交叉法(親から子を作る手法)：BLX-α、UNDX、REXなど

今回は以下の手法を用いました。

世代交代モデル：MGG
- 世代交代数：2個体(エリート選択：1個体、ルーレット選択：1個体)
- 致死個体(任意のパラメータが探索範囲を超えた個体) への対応：探索範囲を超えたパラメータを限界値に設定する
交叉法：BLX-α (α=0.5)

実装

githubに置いています。
https://github.com/SwitchBladeJW/RCGA

評価方法

最適化アルゴリズムを評価するためのベンチマーク関数を用いて評価しました。
様々なベンチマーク関数に関しては、以下に詳しく記載があります。
[最適化アルゴリズムを評価するベンチマーク関数まとめ]
(https://qiita.com/tomitomi3/items/d4318bf7afbc1c835dda)

今回は、Rastrigin関数、Schwefel関数、RosenBrock関数を用いました。最適化対象のパラメータは、x[i]で表しています。パラメータ数(次元数)が増えるほど難易度があがります。

Rastrigin関数

多峰性関数
探索範囲：-5.12～5.12
大域的最適解： = 0 , (x[i] = 0)
2次元のグラフ

関数の実装

def OriginalRastrigin(x , n):
    value  = 0
    for i in range(n):
        value +=  x[i]**2 - 10 * np.cos(2 * np.pi * x[i])
    
    value += 10  * n;
    return value

2次元

最大世代数：300世代
集団数：50個体
生成子個体数: 200個体/世代
初期集団の分布：-5.12～-2.0(次元数が少ないので、最適解を外して分布させています)

X軸に世代数、Y軸に適合度(ベンチマーク関数の出力値)を示しています。

最良個体の適合度は、ほぼ0になっています。

個体の分布を10世代毎に表示しています。赤のプロットが最良個体です。

世代が進むごとに、最良個体・全体的な個体の分布ともに、解であるx[i] = 0に近づいていることが分かります。
しかしながら、突発的に離れた位置出現する個体も出現します。この突発的な個体の発生により、局所解に安直に収束してしまうことを抑止しています。

10次元

最大世代数：10000世代
集団数：300個体
生成子個体数: 200個体/世代

最良個体の適合度：2.6041760747830267e-08
最良個体のパラメータ：[-3.4247764461144783e-06, -3.50417428178406e-06, -2.2482164776969737e-06, -3.4710844379463296e-06, 7.737721637384039e-06, 2.005039335095373e-06, 1.4943778912332043e-06, 1.1181528330355657e-06, -1.3276047526638224e-06, 4.584145661221937e-06]

最良個体の適合度・各パラメータとも、ほぼ0になっていて、大域的最適解を求めることに成功しています。

Schwefel関数

多峰性関数
探索範囲：-512～512
大域的最適解： ≒0 、(x[i] = 420.9687)
2次元のグラフ

関数の実装

def Schwefel(x , n):
    value  = 0
    for i in range(n):
        value += x[i]  *  np.sin(np.sqrt( np.absolute(x[i])))
    value = 418.9828873  * n -value
    return value

5次元

最大世代数：20000世代
集団数：300個体
生成子個体数: 200個体/世代

最良個体の適合度：1.3783119356958196e-07
最良個体のパラメータ：[420.96874642945215, 420.96874622367926, 420.9687463066047, 420.9687462407308, 420.96874637971456]

最良個体の適合度は0、各パラメータは420.9687になっており、大域的最適解を求めることに成功しています。

10次元

最大世代数：30000世代
集団数：300個体
生成子個体数: 200個体/世代

最良個体の適合度：459.013618910642
最良個体のパラメータ：[-512.0, -512.0, -512.0, 420.96874590356066, 420.9687464738711, 420.96874601955557, 420.96874651347804, 420.96874593930437, -512.0, 420.9687465753185]

最良個体の適合度は0になっておらず、各パラメータも-512のものが含まれています。
また、グラフ上で最良個体の適合度と平均値がほぼ同じになってから、数世代変化がないことから、局所解にはまっていると考えられます。
これは、交叉法を変更することにより、改善される可能性はあります。(UNDXであれば、20次元くらいまではいけたはず。)

RosenBrock関数

単峰性関数
探索範囲：-2.048～2.048
大域的最適解： =0 、(x[i] = 1)
2次元のグラフ

関数の実装

def Rosenbrock(x , n):
    value  = 0
    data0 = x[0]
    for i in range(1,n):
        value += (100 * (( x[i]- data0**2)**2) + (data0 -1)**2) ; 
        data0 =  x[i]
    return value

10次元

最大世代数：40000世代
集団数：50個体
生成子個体数: 200個体/世代

最良個体の適合度：0.00231321972664098
最良個体のパラメータ：[0.9997860990802784, 0.9995464743876002, 0.999245405812484, 0.9985238486102694, 0.9972306954418255, 0.9944574214248189, 0.9892222116196303, 0.9794177542383247, 0.9596324800238759, 0.9207654458523167]

ほぼゼロになっていますが、グラフ上では最良個体の適合度、平均値ともまだ下がっているので、最大世代数を増やすとさらに0に近づく可能性があります。

今後やること

~~-実装の整理~~
~~-UNDXの実装~~
~~-ニューラルネットの重み最適化に適用(できれば、TensorFlowを使って)~~

参考

実数値GAのフロンティア
 単峰性正規分布交叉を用いた実数値遺伝的アルゴリズムによる光学系の最適化

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up