JAWS-UG
初老丸Day 15

JAWS-UG AI #9 にいってきた

はじめに

おはようございます。初老インフラエンジニアです。歳を取りすぎて夜寝れなくなってきました。老化つらい。「病気か!?」ってくらい何もかも忘れてしまうので、忘れる以上のなにかを覚えるべく日々の勉強はかかせません。
ということで、まったく門外漢の JAWS-UG AI #9 にいってきた報告です。

ブレインズテクノロジー 中澤さんの Machine Learning at the IoT Edge (たぶん.)

この講演の抜粋を日本語でおこなってくれました。

工場で機械学習をつかって異常検知をする仕組みをつくったという話ですが、AWS IoT Edgeをうまくつかって、モデルのデプロイなんかを簡単におこなえる部分がポイントかとおもいます。おもしろかった話としては以下です。()内は自分の感想

  • Edgeは強力なPC。(greenglass結構リソースつかうので、IoTで想像する貧弱なリソースだと結構つらい )
  • 工場には異なる機能を持つ機械が沢山ある。手で調整はかなり厳しい
  • 異常検知(anomaly detection)は高価な製品に対して有効。(安ければ、捨ててしまうという選択肢で十分な場合がおおい)
  • 中国リージョンでIoT関連リリースされてないサービスがある
  • こないだのソフトバンク障害のような大規模なネットワーク障害でも工場は止められない

前処理の話とかアノマリー検知って結構奥がふかそうで面白そうでした。この会社の製品のImpulseを買えば簡単にできるのかもしません。

mixi 古城さんの 「ゲーム運営と機械学習」

XFLAGというブランドでゲームを提供しているmixiさん
ファイトリーグというゲーム のチューニングに機械学習つかっているという話とその中で、SageMaker RLという強化学習のβサービスをつかった感想の話でした。
資料みつけられませでしたが、覚えている限りで箇条書きしていきます。

チューニングの話

  • ファイトリーグは対戦型のソシャゲ
  • 不正防止のため、クライアントはUIのみでエンジンやデータは全てサーバ側にある。行動履歴もとれる
  • 定期的にキャラクターが追加される。キャラクターには能力の他にスキルがあり、戦略の幅を広げている
  • 戦略の幅をひろがりすぎて、想定外の戦略でゲームバランスが崩れるリスクがある
  • すごい検証チームがいるが、人の限界に達している
  • このリスクを機械学習で回避する
  • トップレベルの人たちに近い行動を機械が行えるらしい
  • 当初キャラクターをパラメータの一つとしていたが、スキルに変更した。スキルはテキストがあり、説明が比較的提携なので特徴量抽出がしやすい
  • 古城さんは、インフラ+ソフトウェア開発の人で、機械学習はじめて半年くらいとのこと

うーん、肝心なことがなにもかけてない。

SageMaker RL β

  • ここらへんの話を実践したという理解
  • トップレベルの人達を超える行動をさせたい
  • どんどん変わってる。コードを読んで理解する気概が必要。ベータだし仕方ない
  • 自分で作ったコードの並列化が難しい

ムラサメ・フォーとか思いだしますよね(それは強化人間)。強化学習がなんだかよくわかってないのではずしてるかもです。
たのしそうに話しているのが印象的でした。

AWS 宇都宮さんの 「機械学習系リリース re:Cap 」

この資料をベースにはなされていたとおもいます。

P.24 の AWS Machine Learning Service Stackが個人的にはヒットしていたのですが、slideshareだと上のほうみずらいですね。そのうち直ることを期待。

ポイントをおさえた淡々とした話し方がよかったです。初老的にはなんとなく理解できた気になれました。

AWS SUNIL MALLYA さんの 「DeepRacer 紹介」

たぶん、ここらへんの話の抜粋です。
https://www.youtube.com/watch?v=M1U_cyAUtU8

本物のDeepRacerを駅前の100円ショップで買ってきたテープでつくった急造コースで走らせていました。
英語苦手なので勘違いしている点おおいかもですが以下抜粋の抜粋

  • Deep Learningを勉強するための教材という位置付
  • みた感じ DeepRacer = TAMIYAのラジコン + Ubuntu + DeepLens
  • Racerといってましたが走ってる姿はとっとこハム太郎という感じでかわいかった。
  • 動作時にネズミの鳴き声のような音がするのはステッピングモーターの音。タイムスライス切ってそれ毎に出力をしているせいと理解。
  • 強化学習って報酬だけあたえたら勝手に学習するんですね。謎すぎです。
  • 報酬はコースにいると+。コース外が-が基本らしいが、センターラインに近いと+みたいなことも与えられるらしい。
  • 入力はカメラ1系統ですが、USBもってるので増やすことは可能(っていってたきがする)
  • 出力は6種類(右、左、加速、減速、、あとわすれた)。
  • シミュレーション環境で学習して、実世界にモデル転送して動かすそうです。かっこいい。
  • 物理環境を完全にシミュレートできないので不思議な動きをする(現状摩擦とかない)

DeepRacer、ルンバに似たかわいさがありました。画像の入力と報酬だけで動くというのが不思議というか納得できないというか複雑な感情でした。もしかして:老害?

あまり質問する人がいないのが印象的でした。まぁ、このシーズンに忘年会によばれることもなく勉強会にくる人間のコミュ障率はたかそうなので仕方ないことかもしれません。自分は言ってはいけないことを言ってしまうタイプのコミュ障なので質問はしたのですが、英語力がたりませんでした。残念でした。

おまけ

会場入口で受付してた人のレベル高すぎな気がしました。HPCと運用の相談があれば、今度しにいこうかとおもいます。