はじめに
2017年9月26日19:30~22:00にサポーターズにて行われた「ツールとしての機械学習:類似画像検索システムを例に機械学習をツールとして利用する方法を学ぶ」の勉強会メモになります。
ニューラルネットワークを使った機械学習の研究がめまぐるしい勢いで進展する中、システムへ組み込む事例が増えてきました。本勉強会は主に、ウェブアプリケーションにどのようにして組み込むかをテーマに、ざっくりとした概要やツールについて簡単にお話されていました。
本勉強会の感想ですが、機械学習フレームワークはWebフレームワークなど違って、ある程度裏側で動いている仕組みを理解しないとツールとして使うことが難しいなと思いました。また、機械学習を学習する上で前提となるのは、理系大学教養課程における初等解析学・線形代数学の知識群になるので、Pythonと併せて少しずつ学習していこうと思っています。
講師紹介:山際康貴 (@tamanobi) ピクシブ株式会社 エンジニア
寄稿:雑誌: WEB+DB PRESS Vol.95
illustration2vec
https://arxiv.org/abs/1603.08511
画像のベクトル化技術で学習済みモデルが配布されている
Ex) 二郎系ラーメンを取るとどの店舗かわかるというようなイメージ
*機械学習を試すのにもってこい
以前は1pxごとに解析して画像を判断していたが、現在は膨大なデータ群から画像とタグを収集してベクトル化することで画像認識を行なっている。
Googleは類似画像検索に関して、テキストデータも併せて精度をあげている。
一般物体認識とは
写真が与えられたときに、これが何でどれくらいの大きさなのか認識する
https://www.slideshare.net/MPRG_Chubu_University/01-objectrecognition
YOLO(You Only Look Once)とは
畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)を用いた物体検出アルゴリズムで、現時点ではv1とv2が存在します。学習済みモデルが配布、気軽に試せてイラストにも応用可能。
https://www.slideshare.net/DeepLearningJP2016/dl-reading-paper20170804pdf

機械学習トピックニュース紹介
10億枚の画像の分類がパソコン1台で可能に)
機械学習による料理/非料理判別
Alternative illustration2vec(高次元タグ予測器)
質疑応答
メモが間に合っていないものもあります...
学習済みかどうかはどう判断するのか?
→チューニング前提で提供されている為、ある程度うまくいっているモデルを指している。
量子化するときに次元数の指定はあるのか?
→ディープラーニングのどの層から取り出す部分によってきまる。
ここでいうレコメンドはどういうものなのか?
→協調フィルタリング。集合知に基づくレコメンドであり、自分と似ている人がブックマークしているものはこの人も好きだろうというもの。
機械学習のキャッチアップはどのように行なっているか
→主に情報に強い人が発信しているツイッターやQiita、はてブ