LoginSignup
1
2

More than 5 years have passed since last update.

Google Developers ML Summit

Last updated at Posted at 2018-12-19

Google Developers ML Summitへ行ってきたのでメモ

詳細内容は公式サイトを見てください。
Google Developers ML Summit

資料

スピーカー:足立昌彦/ Masahiko Adachi(株式会社カブクCEO兼CTO/GDE)
モバイル開発者の為のTensorFlow

スピーカー:田中 洋一郎 / Yoichiro Tanaka(Google Developers Expert (Google Assistant))
Actions on Google 概要

ざっくりメモ

TensorFlowとCloud MLの概要

Googleの考えるAI(人工知能)とは賢いITを作る技術

現在のAIは機械学習(ニューラルネットワーク)

りんごとオレンジの写真の判断方法
色、形等のルールを人間が決めて判断
ITを使用した機械学習では計算機がルールを見つける

デープニューラルラーニング

GPUを使用して階層化により認識を得る
2012年辺りから出来るようになった

Cloud ML API and AutoML

Google側で学習済みのAPI、Google側で自動的にやってくれるAPIなど
画像認識、OCRなどのAPIがある

Cloud AutoML
Cloud Vision
Cloud に画像をアップして学習させれば1日程度で学習する
例:ラーメン次郎のラーメン分類で95%の制度で判別できる

BigQueryML

SQLの機械学習
数百台のサーバーをネットワークにより超並列処理できる
テラバイトを数十秒で処理
クラウドなので経済性が良い
自前のSQLでも使用可能(他に迷惑をかけない)

TensorFlow

機会学習の専門家の為のツール(Googleの社内で使われている)
学習終わったモデルは数Mまで小さく出来、それをモバイルへ入れることも可能
例:船の動き(GPS位置情報)から漁船なのかの判断が出来る
例:DOCOMOのタクシー需要予測

Mobile MLの概要

モバイルデバイスのAPIやラーニングの概要
デバイス上でのマシンラーニング方法

これまではサーバーやGUPで学習していたがスマホなどのデバイス上でのマシンラーニングを行う方が良い事もある
・プライバシー保護:データをサーバーに送らずに出来る
・速度:サーバー上で行うと数秒かかるがデバイス上で行えば瞬時に出来る
・ネット環境へ依存しない:インターネットへの通信を行わない為、通信できない環境でも出来る
・コストが安い:サーバー代、通信代が必要ない

出来る事

・画像処理
・音声処理
・自然言語
・モーション(デバイスの位置動きなど)
Smart Text Selection:自動的にテキストを選択してくれるもの(Android Oから)
音楽が流れているものを調べて検索
Adaptive battery:ユーザーの使用状況でアプリの優先度を分ける
Google keyboard:ユーザーの入力を自動的に補助
Google Translate:カメラでとったものを翻訳

マシーンラーニングを使用したほうが制度も高く、コストもかからない

アメリカでは2/3のアプリがマシーンラーニングを使用している

ML Kit

トレーニング済みのモデルをデバイスに入れて使用する(Base API)

画像の認識
OCR

Custom Model

TensorFlow Liteの機能をML Kitで動かす

TensorFlow Lite

TensorFlowはデスクトップ向けのもので、TensorFlow Liteはデバイス向けのもの
推論系に特化して小さくしいる(400KBくらいのサイズ)
どのプラットフォームでも使用可能

マシンラーニングのモデルがどんどん大きくなっているその為モデルの軽量化をしている
・プルーリング:無くてもよいノードをおとして軽量化しモデル圧縮を実現
・量子化:32ビットを8ビットへ落としても問題なければ落としてモデル圧縮を実現
・Distillation(蒸留):親モデルの結果を真似してモデル圧縮を実現

Neural Network API(NN API)

フレームワークから使用するとうれしいAPI

Edge TPU

AIの“推論専用”プロセッサ

モバイル開発者の為のTensorFlow

発表内容は下記資料
モバイル開発者の為のTensorFlow

ML Kitの概要とBaseAPI

ML KitはIOSとAndroidで使用できるモバイルSDK
Firebase 向け ML Kit

Base APIs

・テキスト認識(OCR)
・画像のラベル付け
・バーコード スキャン
・顔検出
・ランドマーク認識

端末上とクライド上で動作するAPIがある
端末上で動作するAPIは無料でクラウド上で動作するAPIは有料

OCR

端末上で出来るのは英数字(ラテン文字)を認識可能
クラウドAPIでは日本語などの言語も対応している
アプリに組み込む場合はある程度読み込むものをフィルタリングしておく必要がある
日本語や中国語などは大きく写っていないと認識できない

顔検出

同じ顔の人には同じIDがつく
顔の外の輪郭i以外にも目、眉毛、口、鼻などの輪郭もがとれる

バーコードスキャン

1次元、2次元バーコードの読み込みや同時に複数のバーコードが読み込みも可能

画像のラベル付け

端末上のAPIは早いがラベルの種類は少ない
クラウド上のAPIはラベルの種類が豊富

ランドマーク認識

画像から有名なものを認識できるAPI
ランドマーク名や地理座標等を取得可能

ML Kitの使い方

端末上で使用する場合はアプリインストール時にモデルをダンロードするように設定しておく必要がある
設定しないと初回はエラーが出る

クラウドのAPIを使用する場合は課金設定をする必要がある

1
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
2