More than 5 years have passed since last update.

配牌からアガれるかアガれないか予測する

Posted at 2017-02-26

はじめに

個人的にディープラーニングや機械学習を学習したいと思い、O'Reilly Japanさんから出版されているゼロから作るDeep Learningを読みました。
しかし、私自身に知識がなく、いまいちピンとこなかったので、簡単なものを作ってみようと考えました。

とはいえ、せっかくなら自分の趣味でもある麻雀に関わるところで作ろうと考えました。

作成したアプリは下記になります。
https://python-mahjang.herokuapp.com/index

また、ソースコードは下記になります。
https://github.com/naoki85/python_mahjong

教師データはYoutubeなどでプロの対局を見て、配牌と結果を収集しました。
数としては100いっていないため、これは継続して収集します。

配牌を以下の3つのノードに分解しています。

各ノードの重みはゼロから作るDeep Learningを参考に、勾配法で推定しています。

Youtubeにあがっていたとあるネット麻雀の動画で試してみました。

局	結果	あがれる確率	あがれない確率
東1局	あがれない	17%	83%
東2局	あがれない	29%	71%
東3局	あがれない	7%	93%
東3局1本場	あがれない	17%	83%
東4局	あがれない	33%	67%
南1局	あがれる	20%	80%
南1局1本場	あがれない	26%	74%
南2局	あがれない	17%	83%
南3局	あがれる	26%	74%
南4局	あがれる	23%	77%

パッと見、ちゃんと予測できているようには見えないです。
よく考えたら、麻雀は4人のうち1人があがれるゲームなので、単純計算でアガれる確率は25%です。
教師データが足りないのかもしれないと思い、とりあえずプロの対局1局分追加してみました。

同じ動画で再度試してみました。
アガれない結果のみを比較してみます。

局	結果	前回のアガれない確率	再テストのアガれない確率
東1局	あがれない	83%	73%
東2局	あがれない	71%	64%
東3局	あがれない	93%	92%
東3局1本場	あがれない	83%	80%
東4局	あがれない	67%	72%
南1局	あがれる	80%	85%
南1局1本場	あがれない	74%	79%
南2局	あがれない	83%	80%
南3局	あがれる	74%	79%
南4局	あがれる	77%	73%

10局のうち、6局の「アガれない確率」が下がっています。
やはり、教師データを増やせば結果は変わってくるようです。

学習させた重みパラメータは下記になります。
第1要素がアガリへの寄与、第2要素がアガれない方への寄与になります。

# 第一要素があがれる方、第二要素があがれない方
# 重み
[[ 0.17258578  -0.17396835]    # 順子
  [ 0.20088727 -0.20564398]    # 対子
  [-0.33262621  0.34681625]]  # 暗刻

この結果を見ると、順子、対子はアガリに寄与していますが、暗刻は逆にアガリに寄与していないようです。
暗刻があると手が狭くなるからでしょうか？

バイアスパラメータは下記になります。
すでにアガれない方のバイアスが高すぎます。

[-1.07893278  1.07893278]

現在は下記の2点を課題としてあげて勉強しようと思っています。

今回このWebアプリを作ったのは、教師データを増やす上で入力を楽にしたいためです。
その過程でPythonの軽量FWであるbottleについて学べて良かったと思っています。

ディープラーニングも学習したてで、何をして良いのかもよく分かっておりません。
（そもそも麻雀という不確定要素の塊を題材にすること自体ナンセンスなのかもしれませんが。。。）

そのため、ご指摘やそもそも間違っているなどのご指導ありましたらコメントをください！
（アドバイスなどもいただけると嬉しく思います。）