RNN Camp 7月予定
Googleの機械学習プロダクトのアップデート
SyntaxNetくらいしかアップデートなかった
ニューラルネットを組み合わせることでいい感じにパーシング
アカデミックなモノと比べて劇的に素晴らしいモノではない
OSSで公開されてるのですぐ使えるよ
既存のGCPのMLサービス 製品動向
- GA
- Vision API
- Translate API
- Alpha
- Speech API
- Machine Learning
もうちょいしたらSyntaxNetに関わるサービス出る
TPU
CPUでもGPUでもない新しいプロセッサ
このためにハードウェアエンジニアを大量採用してチップを作った
8bitってミスリーディングだよ
8bitはCPUじゃないよ
0から作った
Tensorflowで使う階数演算に特化
8bitの中で演算
これによってパラメータのサイズが4分の1とかになる
Shared Memoryに収まるように苦労してるけど、TPU使うと4分の1になるので楽になる。
最大の性能は電力消費。
Tensorflow使ってる人への恩恵は今のところ提示してない
AlphaGoとかには使ってる
提供されるようになると、コストメリットがある
来週
Tensorflowで趣味の画像収集サーバーを作る 6月号
有山さん
機械学習初心者
好みの眼鏡っ娘画像を自動で収集したい
眼鏡っ娘という表記揺れ重要。
×メガネっ娘
○めがねっ娘
この話だけで20分いけるw
2クラス分類
眼鏡っ娘かそうでないか。
GPUが使えない→ミスだった(GPUをTensorflowが認識してなかった)
きちんとドライバインストールしましょう
同人誌を作ろう
Tensorflowはじめました→作った
執筆上の課題
CIFAR-10に還る
10クラス分類
ただで公開されてる。
チュートリアルがチュートリアルじゃなかったんで1から作った
cuda-convnet
色んなモノを加えると認識がちょっとずつ上がっていく
元の論文の数式はよく分からん
データフロープログラミング初めてだった
重みの可視化
認識精度は向上しなかったけど試したこと
バッチサイズ1でやってたので計算時間増加してしまった
なぜ増やさなかったのか?
処理を最初からやり直さないといけなかったり
→バッチサイズを64にしたら大幅に短縮した
バッチサイズ1の時は20%しか使われてなかったけど、64にしたらフルフル使うようになった
唐揚げロボ
唐揚げをつかむロボットの宣伝w
アールティ ロボットの会社
Pepperのプロトタイプ開発とか
人工知能こんな感じで分かれる
- 身体知
- 形式知
- 大体弱いAI
機械学習はどちらにも使える
ニューラルネットは食品と深い関係がある
30年くらい前
- 神経が実際に見たい!
- 巨大軸索を持つのは何か?
- イカ
- イカを飼った
- アンモニアを抜けばイカを飼えるようになった
- 世の中のいけすで飼ってるイカはこれのおかげ!!
食品を扱うロボットは今は調理の所まで。
弁当に詰めたりとかはおばちゃんがやってる。
柔らかいモノをつかむとか難しい。
油でツルツル滑るから唐揚げ扱うのは難しかったw
NEKONOTE
以下を基準に産業ロボットが作られている
- コンパクトに作る
- 人にぶつかっても痛くない
重力補償でほどよい力加減
データ用の唐揚げを毎週土曜日揚げ続けた
ROS使えるようになると仕事が来るよ
不正解データとして何を用意した?
人間にとって不正解のを入れ続けた
唐揚げを「つかむ」必要があったのか?
仕事でつかむロボットの開発をしているため。
食品ロボットの中では最後のフロンティア。
弁当に詰めるところをロボット化したいという需要がめっちゃある。
TensorFlowで逆強化学習
ブレインパッド 太田さん
良いとは?
様々な「良い」
逆強化学習
エキスパートの行動を元に良さを考える。
カウンセリングはゴールがあるけど指標化するのが難しい
何かわからんけど、すごい人はこういう感じでやってるからいいんだろう、みたいな学習方法
良さから学習する強化学習の逆。
TensorFlowでDQN
DQNの理論的な話
ビデオゲームを学習する
Deep Learningが出る以前からQ Learningと言うのがあった
ディープラーニングが出てそれ組み合わせたらすげーうまいこといった
実装しようとすると一番難しいのは、データをかき集めるところ
データ収集と学習をパラレルでやっていくのがいい。
July Tech Festa 2016で倒立振子の問題話すよ
TensorFlowとGymを使ってDoubleDQN
ダブルドキュン
何がダブるか?
同じ構造のニューラルネットワークが二つ
1つは今どうなるかを予測するネットワーク
2つめは取るべき行動の評価するネットワーク
同じ構造である必要がある。
それぞれが近くなるようにする。