More than 5 years have passed since last update.

tensorflow 勉強会 #4

メモ

Last updated at 2016-06-23Posted at 2016-06-23

RNN Camp 7月予定

Googleの機械学習プロダクトのアップデート

SyntaxNetくらいしかアップデートなかった
ニューラルネットを組み合わせることでいい感じにパーシング
アカデミックなモノと比べて劇的に素晴らしいモノではない

OSSで公開されてるのですぐ使えるよ

既存のGCPのMLサービス製品動向

GA
- Vision API
- Translate API
Alpha
- Speech API
- Machine Learning

もうちょいしたらSyntaxNetに関わるサービス出る

TPU

CPUでもGPUでもない新しいプロセッサ
このためにハードウェアエンジニアを大量採用してチップを作った

8bitってミスリーディングだよ
8bitはCPUじゃないよ

0から作った
Tensorflowで使う階数演算に特化
8bitの中で演算
これによってパラメータのサイズが4分の1とかになる
Shared Memoryに収まるように苦労してるけど、TPU使うと4分の1になるので楽になる。

最大の性能は電力消費。
Tensorflow使ってる人への恩恵は今のところ提示してない
AlphaGoとかには使ってる
提供されるようになると、コストメリットがある

来週

Tensorflowで趣味の画像収集サーバーを作る 6月号

有山さん

機械学習初心者

好みの眼鏡っ娘画像を自動で収集したい
眼鏡っ娘という表記揺れ重要。
×メガネっ娘
○めがねっ娘

この話だけで20分いけるｗ

2クラス分類
眼鏡っ娘かそうでないか。

GPUが使えない→ミスだった（GPUをTensorflowが認識してなかった）
きちんとドライバインストールしましょう

同人誌を作ろう

Tensorflowはじめました→作った

執筆上の課題

CIFAR-10に還る
10クラス分類
ただで公開されてる。

チュートリアルがチュートリアルじゃなかったんで1から作った
cuda-convnet

色んなモノを加えると認識がちょっとずつ上がっていく
元の論文の数式はよく分からん

データフロープログラミング初めてだった

重みの可視化

認識精度は向上しなかったけど試したこと
バッチサイズ1でやってたので計算時間増加してしまった
なぜ増やさなかったのか？
処理を最初からやり直さないといけなかったり

→バッチサイズを64にしたら大幅に短縮した

バッチサイズ1の時は20％しか使われてなかったけど、64にしたらフルフル使うようになった

唐揚げロボ

唐揚げをつかむロボットの宣伝ｗ
アールティロボットの会社

Pepperのプロトタイプ開発とか

人工知能こんな感じで分かれる

身体知
形式知
- 大体弱いAI

機械学習はどちらにも使える

ニューラルネットは食品と深い関係がある
30年くらい前

神経が実際に見たい！
巨大軸索を持つのは何か？
イカ
イカを飼った
アンモニアを抜けばイカを飼えるようになった
世の中のいけすで飼ってるイカはこれのおかげ！！

食品を扱うロボットは今は調理の所まで。
弁当に詰めたりとかはおばちゃんがやってる。
柔らかいモノをつかむとか難しい。

油でツルツル滑るから唐揚げ扱うのは難しかったｗ

NEKONOTE

以下を基準に産業ロボットが作られている

コンパクトに作る
人にぶつかっても痛くない

重力補償でほどよい力加減

データ用の唐揚げを毎週土曜日揚げ続けた

ROS使えるようになると仕事が来るよ

不正解データとして何を用意した？
人間にとって不正解のを入れ続けた

唐揚げを「つかむ」必要があったのか？
仕事でつかむロボットの開発をしているため。
食品ロボットの中では最後のフロンティア。
弁当に詰めるところをロボット化したいという需要がめっちゃある。

TensorFlowで逆強化学習

ブレインパッド太田さん

良いとは？

様々な「良い」

逆強化学習

エキスパートの行動を元に良さを考える。

カウンセリングはゴールがあるけど指標化するのが難しい

何かわからんけど、すごい人はこういう感じでやってるからいいんだろう、みたいな学習方法
良さから学習する強化学習の逆。

TensorFlowでDQN

DQNの理論的な話

ビデオゲームを学習する

Deep Learningが出る以前からQ Learningと言うのがあった
ディープラーニングが出てそれ組み合わせたらすげーうまいこといった

実装しようとすると一番難しいのは、データをかき集めるところ
データ収集と学習をパラレルでやっていくのがいい。

July Tech Festa 2016で倒立振子の問題話すよ

TensorFlowとGymを使ってDoubleDQN

ダブルドキュン
何がダブるか？

同じ構造のニューラルネットワークが二つ
1つは今どうなるかを予測するネットワーク
2つめは取るべき行動の評価するネットワーク
同じ構造である必要がある。

それぞれが近くなるようにする。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up