Help us understand the problem. What is going on with this article?

SGDで教師のランダム性はどの程度必要なのか

More than 3 years have passed since last update.

という悩みが生まれたので、実験してみた結果の備忘録。

前提

  • 進行度の学習で実験した。
  • 特徴はKとP。教師は約5万棋譜(約500万局面)。AdaGradを使用したロジスティック回帰。

特徴に対して教師の数がとても過剰に多いので、教師が多ければ解決するものであれば差は出にくい事に注意が必要。
(教師が多くても解決しない問題の方に興味があるので)

やったこと

  • 棋譜をシャッフルしたり、SFENのASCII順にしたり。
  • 全局面(約500万局面)を均等にシャッフルしたり、棋譜の手順そのままにしたり、半端にシャッフル(1024分割してそれぞれをシャッフル)したり。

これらの組み合わせで16-fold cross-validationして、Mean absolute errorを算出。

実験結果

棋譜 局面 MAE
- シャッフル 7.38%
シャッフル 棋譜の手順そのまま 7.42%
SFENのASCII順 棋譜の手順そのまま 7.52%
シャッフル 半端シャッフル 7.39%
SFENのASCII順 半端シャッフル 7.58%

結論

  • ちゃんとシャッフルしたのが最優秀。シャッフル無しはそれなりに悪い。
  • しかしこの条件ではそれほど大きい差でもなかった。
  • 半端なシャッフルは、棋譜がソートされているとシャッフルしないより悪い。(棋譜がランダムな場合はまだマシだけど…)

差がそれほど出なかった事はやや意外だったけど、順番的にはだいたい予想通りだったので一安心。

Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away