1.はじめに
ディープラーニング協会のG検定2019#2を受験し何とか合格させていただきました。学習の中で第1次~第3次のAIブームの内容が真っ先に出てきます。概念はあるのですが実例と紐づいていない本が多く、とっつきにくいかと思います。
ちなみに私は過去にコンピューター将棋の解説番組を視聴していてその内容を紐づけることで理解できたと思っています。そのため自身の整理も含めて将棋ソフトとAIブームを紐づけることで理解の助けになればと思っています。
1.1 注意事項
コンピューター将棋については私自身製作に関わったことも製作者に知人もおりません。
あくまで過去の番組を見た記憶のみで記載しています(リンク参照)。また古い番組ですのでなかなか再放送やペイパービューもないため記憶違い等があるかもしれません。また紐づけは私の主観であり、間違いがあったらどんどん突っ込んでください。
2.第1次AIブーム
探索と推論の時代
これは将棋でいうなら詰将棋になります。
「詰みという状態が明確なゴール」を目指して力任せを効率的に行います。
3.第2次AIブーム
エキスパートシステムの時代
これはBonanza以前のソフトと言えます(詰みモード以外)。
古くは内藤國雄9段の将棋、森田将棋など。
詰将棋ではゴールが明確ですし、詰む/詰まないも明確です。
しかし、詰みがない状態であればどうすればいい方向に向かうのか定義するのは難しいのです。一つの手法として駒得もありますが陣形の差だってありますし、多少駒損でも敵陣にと金がいっぱいあって勝勢ということもあります。
そのためこの当時はアマチュア有段のような将棋が強い人が
<駒の価値>
・飛車:500点、角:480点、金:400点・・・歩:1点
<陣形の価値>
・王が8八にいれは200点、金が7八にいれば180点
王が7八にいれば180点・・・・
といったことを手で設定していました。いわゆる評価関数です。
まさにアマチュア有段者という「エキスパート」な人たちがその知識をシステムにしようとしていた時代といえます。
4.第3次AIブーム
機械学習、深層学習
これはBonanza以降の将棋ソフトです。
将棋の棋譜を機械学習させ、評価関数を高めるようにします。
Bonanzaは将棋の駒の配置の三角形(8八王-7八金-7七銀など)を
実際の将棋の棋譜に近付けるよう学習させたそうです。
いわゆるプロの棋譜という教師あり学習です。
最近ではロボット同士で戦わせて強化していく強化学習を使っているようです。
5.リンク
将棋スペシャル「第25回 世界コンピュータ将棋選手権」
第24回世界コンピュータ将棋選手権
※もっと古いものも見ていたはずなのですがリンクが見つかりませんでした。
180215 Ponanzaにおける強化学習、ディープラーニングとその先(slideshare)