おはようございます.昨晩はお酒を沢山頂きまして,いい感じに体がだるい私です.
新潟だもの.日本酒だって飲むさ.
ということで人工知能学会全国大会新潟,JSAI2019の最終日たる4日目です.
4日目は少し日程が変わりまして,午前中はパネル発表,午後早めにセッション開始となります.
#1.パネル発表
パネルディスカッションの方はFintechやIndustryなものが多く,興味に触れるものが少なかったのですが,それでもいくつか面白そうなのがあったのでご紹介.
##即時戦略ゲームにおけるAI学習プラットフォームの構築 及びDQNによるAIの実装
張 翌坤1、橋山 智訓1、田野 俊一1 (1. 国立大学法人電気通信大学)
https://confit.atlas.jp/guide/event/jsai2019/subject/4Rin1-09/tables?cryptoId=
最近少しずつ流行っているRTS(リアルタイムシュミレーション)のAIエージェントについての発表でした.
1ヶ月前ぐらいにstarCraftというRTSゲームでAIがプロに買ったという大ニュースがありました.
今まで囲碁やチェスなどの完全情報ゲームでAIが人に勝ったというのはよくありましたが,RTSはゲーム自体が複雑な上に不完全情報ゲームです.
それなのにAIが人のプロに勝った,衝撃的です(ただしAI側はMAPが全域で見える等の”ズル”もあったそうですが.
発表者さんも,パネル発表一週間前にそのニュースが流れて来て胃が痛くなったそうです.
paper自体はまだ出ていないのですが,出たら絶対に見ます.
んでこの方の発表に話を戻すと,2レーン+飛行ユニットによるタワーディフェンスバトルでシュミレーションした強化学習によるエージェント生成でした.
学習したエージェントを観察すると,一方向のレーンをひたすら攻めるレーンになったそうです.
いやまあわかります.簡単に思いつけてそうすりゃ勝てるんならそうするもの.
ただ,人vs人でやった時に単純な戦略ではより複雑な戦略に負けるようなゲームにそもそも設計しないとよくないのでは?という素人意見を持ちつつ.
学習済みのエージェントの勝率は64%といまいちな勝率になったそうで,Policyの調整で勝率が伸びそうと考えているそうです.
シュミの方で興味がある分野ゆえ、しばらく追ってみようかと思います.
#2.セッション発表
##頻出部分グラフに基づくレシピフローグラフの分散表現の獲得
二宮 あかり1、尾崎 知伸1 (1. 日本大学)
https://confit.atlas.jp/guide/event/jsai2019/subject/4B2-J-3-01/tables?cryptoId=
日本大学,尾崎ゼミ院生二宮さんの発表です.
卒論発表でも見ましたが,あるレシピの食材Aを代用できる食材Bを見つけれるようにしようという研究.
cookpadのレシピを分散表現(word2vec,doc2vec)とフローグラフで表現.
前から面白いなーと思っている研究です.
私の興味がある分野とはずれているので特にコメント等はできないのですが,レシピを分散表現・フローグラフで表現するというのが面白いですよね.確かに表せるのが面白いです.
食材をベクトル近い順でテキトーにーとかではないのがいいです.
##多人数ゲームにおける,集団に対する予想の分析
井上 輝義1、福田 玄明1、植田 一博1 (1. 東京大学)
https://confit.atlas.jp/guide/event/jsai2019/subject/4N2-J-7-03/tables?cryptoId=
多人数参加型のゲームで人の戦略をモデル化し,他の参加者群を考慮し戦略を取るプレイヤーがいるかどうかという発表.
方向性はすごく興味深かったです.世の中多人数参加型ゲームというのは大量にあります.
当然遊戯ゲームでも多いですし、社会上のeventでもそういったことは多いと思います.
この発表では意思決定を3つのモデルにして居ました.
ランダムと正規分布と一点集中の3つです.詳しくはpaperを見てください.
実験の結論として他人を考慮して戦略を決定する人は少ないというものでした.
個人的に興味深いのはモデルをゲーム初心者から上級者までそれぞれ分布した際にどうなるのかなと.
知識不足でうまく言えませんが面白そうです,今後もwatchしようと思います.
##「待った」の概念を取り入れた効率的なオセロの学習
〇成田 穂1、木村 大毅2 (1. 東京大学、2. IBM Research AI)
https://confit.atlas.jp/guide/event/jsai2019/subject/4O3-J-7-01/tables?cryptoId=
AlphaZeroは事前知識なし24時間の学習から将棋のプロに勝利する性能を獲得して話題になった
モンテカルロ法と深層学習を交互に用いた学習
しかし学習に非常に大きな計算コストが必要
しかし自己対戦に5000こ、パラメーター更新に64個のTPUが必要→一般的な汎用マシンでは不可能
そこで効率的に学習を行うアルゴリズムを作ろう
「待った」ボードゲームにおける練習試合で失敗した手をやり直して別の手を試す
この「待った」という概念をAIに利用する
失敗した局面を重点的に学習,なぜなら「失敗する」局面というのはゲームにおいて重要であることが多い
予測勝率の下げ幅の大きな手の周辺を重点的に学習する
この提案手法ではAlphaGoの手法に,自己対戦時に失敗した手の周辺を優先的に探索している.
実験結果としては,イテレーションが少ない時に提案手法の方が勝率が60%と10%ほど勝ち越しているのがわかる.
イテレーションが増えてくると従来手法も全てのパターンを学習してくるので,従来手法の勝率が拮抗し始める.
という発表でした,着眼点がとても面白い発表です.直感的に感じたのがこの手法だと「
負けそうな中でも,最後の詰みの手を取らないようにする」というナイーブな探索を行なっている気がします.
なのでこの手法は相手の愚かな手を掬うような待っているように感じるのです.
ひたすら負けないよう(ナイーブ)に戦いつつ,後に相手の愚かな手(ミス)を拾うことで勝てるエージェントになると私は考えたのです.
しかしテスト時にそのような傾向があったのか伺ったのですが,そんなことはないそうで.
なんでだろうなーと疑問です.もうちょっと質問したい.私気になります.
##敵対的生成ネットワークによる洪水氾濫浸水域の推定
一言 正之1、荒木 光一2、古木 宏和1
https://confit.atlas.jp/guide/event/jsai2019/subject/4K3-J-13-02/tables?cryptoId=
東京というのは洪水(津波)が起きたらやばい都市です.平地ですからね、そりゃやばいです.
この研究はpix2pixによる画像変換をGAN(対立型学習)でMAPの浸水範囲を推論できるようにしようという研究です.将来的には避難準備のデータとして役立てたいそうです.
最初の方の話を聞きそびれてしまったのですが,実験結果ではかなりうまくいってるようです.
ただし、氾濫初期ではあまり良い結果が出ず,全般的に学習データが足りて居ないのでまたまだ改良の余地があるそうです.
##適応的ハイブリッド交通流シミュレーションのための基礎的検討
〇大野 詩歩1、藤井 秀樹1、吉村 忍1 (1. 東京大学)
最後に聴講した発表です.
交通シュミレーションは主に3種類あり
「車両群を流体として近似」
メゾモデル「個別に車両をモデル化」
ミクロモデル「個別に車両をモデル化.車両間の相互作用や挙動を詳細に模写する」
で、3番目が主に用いられているんだとか.
ただし規模が大きかったり,車両エージェントすうが多くなると計算時間が膨大になってしまうので、現在はミクロとメゾモデルのメゾットモデルが多く使われているそうです.しかし計算量の増加や精度低下とうの問題も.
なので,交通の動的な変化に応じてミクロモデルとメゾモデルを適応的に切り替えることで,精密性と行為規制を両立したシュミレーションの作成を目指したそうです.
ミクロモデルとメゾモデル両方で計算時間と精密性を測る実験を行なったところ,それぞれ特徴的な差があるscoreを見て取れました.
今後ミクロとメゾのハイブリット構築を行い,適切なモデル構成を目指すそうです.