More than 5 years have passed since last update.

コンピュータ将棋開発失敗メモ(1)終盤でKKPT(KPPを含まない)を試してみたがダメだった話

Last updated at 2018-03-27Posted at 2018-03-27

注意事項

KPPTからKKPT型評価関数へではKKPTという用語はKKPT+KPPと定義されていますが本稿ではKKPTのみの評価関数を指すものとします。

将棋の終盤において、既存のKPPT型の評価関数より軽量な評価関数であるKKPT型の評価関数を用いて深く読んだ方が強い可能性があると考えて実験してみたがKPPTが優れているとの結論を得た。

ゲームAIの探索において評価関数による評価はよく行われているが囲碁の死活、将棋の詰不詰など結局深く探索しないと結論が出せないケースはよくある。
将棋の終盤において評価関数の良さよりも読みの深さの方が重要な可能性があると考えた

KPPT型評価関数と表現力は弱いが高速なKKPT型評価関数を搭載したソフトを対戦させる。できる限りオープンソースで手に入るものを利用し、必要に応じて改変した。

やねうら王¹のKKPT+KPP型評価関数のコードを流用してKKPTのみ計算するように書き換えた

上記で作ったエンジンのlearnコマンドと110億局面教師データ²を用いて評価関数ファイルを作成した

	KPPT	KKPT
探索エンジン	やねうら王	やねうら王を改変
評価関数	elmo_sdt5³	110億局面で学習したKKPT型評価関数

対戦条件
対戦数	100
対戦開始局面	floodgate2017互角局面集（100手目、評価値±100以内）⁴
思考時間	秒読み1秒(btime=1000)
CPU	Ryzen 7 1700
スレッド	1スレッド
（やねうら王のソースコード内のengine_invoker1.pyを利用して対戦した。各種パラメータはこちらのソースコード参照。）

97勝3敗でKPPT型評価関数の勝利であった。

本当はもうちょっと条件を変えてやってみるつもりだったがあまりの差にやる気を失った。
「攻め駒への利き」「挟撃形」「攻め駒と受け駒の関係」などをより正確に評価できるKPPの利点がKKPTの深さの利点をはるかに上回るのだろう。

やねうら王の探索パラメータ（改変せずにそのまま使用）がKKPTにマッチしていない可能性
(でもこの差が埋まることはないだろう....)