LoginSignup
1
2

More than 5 years have passed since last update.

tensorflow 勉強会 #4

Last updated at Posted at 2016-06-23

RNN Camp 7月予定

Googleの機械学習プロダクトのアップデート

SyntaxNetくらいしかアップデートなかった
ニューラルネットを組み合わせることでいい感じにパーシング
アカデミックなモノと比べて劇的に素晴らしいモノではない

OSSで公開されてるのですぐ使えるよ

既存のGCPのMLサービス 製品動向

  • GA
    • Vision API
    • Translate API
  • Alpha
    • Speech API
    • Machine Learning

もうちょいしたらSyntaxNetに関わるサービス出る

TPU

CPUでもGPUでもない新しいプロセッサ
このためにハードウェアエンジニアを大量採用してチップを作った

8bitってミスリーディングだよ
8bitはCPUじゃないよ

0から作った
Tensorflowで使う階数演算に特化
8bitの中で演算
これによってパラメータのサイズが4分の1とかになる
Shared Memoryに収まるように苦労してるけど、TPU使うと4分の1になるので楽になる。

最大の性能は電力消費。
Tensorflow使ってる人への恩恵は今のところ提示してない
AlphaGoとかには使ってる
提供されるようになると、コストメリットがある

来週

Tensorflowで趣味の画像収集サーバーを作る 6月号

有山さん

機械学習初心者

好みの眼鏡っ娘画像を自動で収集したい
眼鏡っ娘という表記揺れ重要。
×メガネっ娘
○めがねっ娘

この話だけで20分いけるw

2クラス分類
眼鏡っ娘かそうでないか。

GPUが使えない→ミスだった(GPUをTensorflowが認識してなかった)
きちんとドライバインストールしましょう

同人誌を作ろう

Tensorflowはじめました→作った

執筆上の課題

CIFAR-10に還る
10クラス分類
ただで公開されてる。

チュートリアルがチュートリアルじゃなかったんで1から作った
cuda-convnet

色んなモノを加えると認識がちょっとずつ上がっていく
元の論文の数式はよく分からん

データフロープログラミング初めてだった

重みの可視化

認識精度は向上しなかったけど試したこと
バッチサイズ1でやってたので計算時間増加してしまった
なぜ増やさなかったのか?
処理を最初からやり直さないといけなかったり

→バッチサイズを64にしたら大幅に短縮した

バッチサイズ1の時は20%しか使われてなかったけど、64にしたらフルフル使うようになった

唐揚げロボ

唐揚げをつかむロボットの宣伝w
アールティ ロボットの会社

Pepperのプロトタイプ開発とか

人工知能こんな感じで分かれる

  • 身体知
  • 形式知
    • 大体弱いAI

機械学習はどちらにも使える

ニューラルネットは食品と深い関係がある
30年くらい前
- 神経が実際に見たい!
- 巨大軸索を持つのは何か?
- イカ
- イカを飼った
- アンモニアを抜けばイカを飼えるようになった
- 世の中のいけすで飼ってるイカはこれのおかげ!!

食品を扱うロボットは今は調理の所まで。
弁当に詰めたりとかはおばちゃんがやってる。
柔らかいモノをつかむとか難しい。

油でツルツル滑るから唐揚げ扱うのは難しかったw

NEKONOTE

以下を基準に産業ロボットが作られている

  • コンパクトに作る
  • 人にぶつかっても痛くない

重力補償でほどよい力加減

データ用の唐揚げを毎週土曜日揚げ続けた

ROS使えるようになると仕事が来るよ

不正解データとして何を用意した?
人間にとって不正解のを入れ続けた

唐揚げを「つかむ」必要があったのか?
仕事でつかむロボットの開発をしているため。
食品ロボットの中では最後のフロンティア。
弁当に詰めるところをロボット化したいという需要がめっちゃある。

TensorFlowで逆強化学習

ブレインパッド 太田さん

良いとは?

様々な「良い」

逆強化学習

エキスパートの行動を元に良さを考える。

カウンセリングはゴールがあるけど指標化するのが難しい

何かわからんけど、すごい人はこういう感じでやってるからいいんだろう、みたいな学習方法
良さから学習する強化学習の逆。

TensorFlowでDQN

DQNの理論的な話

ビデオゲームを学習する

Deep Learningが出る以前からQ Learningと言うのがあった
ディープラーニングが出てそれ組み合わせたらすげーうまいこといった

実装しようとすると一番難しいのは、データをかき集めるところ
データ収集と学習をパラレルでやっていくのがいい。

July Tech Festa 2016で倒立振子の問題話すよ

TensorFlowとGymを使ってDoubleDQN

ダブルドキュン
何がダブるか?

同じ構造のニューラルネットワークが二つ
1つは今どうなるかを予測するネットワーク
2つめは取るべき行動の評価するネットワーク
同じ構造である必要がある。

それぞれが近くなるようにする。

1
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
2