はじめに
唐突ですが、中日ドラゴンズファンです。
ドラフトやFAで選手が入替る度に、何となく「あ、この選手中日っぽいな」「あ、この選手中日っぽくない雰囲気」と感じていました。
この『っぽい』という感覚。
この第6感。
「こういう特徴を人は『っぽい』と感じている」と、AIで人の感覚可視化できないものか。
ということで、やってみましょう。
仮説とゴール
仮説
選手の顔には、球団をグループ化できる特徴があると仮定する。
カリスマ⇔いぶし銀度だったら、中日ドラゴンズの選手はいぶし銀のグループが多そうなイメージ、とか。。。
このグループ化できるよな「何がしかの特徴」が『っぽい』感を醸し出している特徴であると考える。
ゴール
AIで、球団別の選手の顔の特徴を抽出したい。(「何がしか」の特徴が何なのか、を可視化したい)
けれども、、、そのような大量データは持ち得ていないので、、、まずは中日ドラゴンズの投手と野手で何がしかの特徴が得られないか?試してみたいと思います。
結果
学習させたAIでのテスト結果は以下です。
学習を重ねても正解率(オレンジの線)が全く上がってきません。。。誤解答(青色の線)も下がっていきません。。。
残念ながら、、、**「投手と野手をグループ化できるような特徴 =『っぽい』特徴」 は得られていない。。。**という結果に。
考察と今後の方針
考察
-
データの問題?
- 画像の解像度?(50ピクセル×50ピクセルで学習させた。解像度が低すぎ?)
- 画像の量が少なすぎた?(学習画像40枚(元画像20枚+水増し20枚)では、やはり足りない?)
-
そもそも論(仮説に対して)
- 投手と野手という分類では、『っぽい』特徴はそれほど見られない?
- 球団別(そもそもの目的ではありますが…)であれば、何がしか特徴が見られる?
-
そもそも論(手段)
- 今回は深層学習のモデルを利用しましたが、他にベターな手段(主成分分析とか??)がある???
今後
- 仮説は成立する、という強い気持ちで、「データの問題」を解決すべくもう少し模索していきたい
- そもそものゴールに近づくべく、球団別の特徴可視化を模索してみたい。
やったこと
ドラゴンズ顔判定Webアプリ作成
最初に、中日ドラゴンズの投手と野手を学ばせた、投手・野手判定モデルを作成します。
せっかくなので、投手・野手判定モデルをWebアプリで試せるようにしてみます。
公開したWebアプリ
http://www.amikano.net/index.html
ソースはこちら
github
作業内容詳細
No | 作業内容 | 利用技術・環境等 |
---|---|---|
1 | データ収集、加工、水増し | openCV |
2 | 投手と野手学習モデルを作成 | keras(VGG16) |
3 | Webアプリ作成 | HTML5/JQuery/PHP |
4 | 開発環境構築 | |
5 | 本番環境構築 | さくらVPS(CentOS7) |
6 | Webアプリリリース | - |
学習したドラゴンズ顔の可視化
次に、『っぽい』を可視化してみます。
(今回は、上記の「結果」からも明らかになったように『っぽい』特徴は得られませんでしたが、、、)
学習時のパラメータを可視化した結果です。
もはや、人の目では何が何だか分かりません、、、
作業期間
3週間(うち半分は開発環境構築(Docker)の模索…)
おまけ(自分語り)
仕事でJava/C#/PHPを使った開発の経験はありましたが、機械学習や人工知能に関する知識は、「ゼロから作るDeep Learning」を読んでみた、という程度(内容サッパリ分からず)という状態でした。
2017年12月には、DeepLearning検定受けてみて見事落ちたくらいですし。。。
今年に入ってから本腰を入れて勉強を始め、3ヶ月を過ぎました。
機械学習の素人でも、3ヶ月くらいあればとりあえず形になるものができあがるのだなと思いました。
(Webアプリ作成に関しては、環境構築の方が苦労したという・・・残念なお話・・・)