More than 3 years have passed since last update.

現場で使われるディープラーニング手法8選を一切コードを使わず解説画像分類編

Last updated at 2020-12-20Posted at 2020-12-06

画像認識と転移学習(VGG16)

このpartでは、

の4つを解説します。

ImageNetデータセットで事前にパラメータ学習されたモデル。1000クラスを分類可能。
Input:(channel,height,width)=(3,224,224) Output:1000

パラメータ学習済みモデル(VGG16など)をベースに、最終出力層を分類したいクラス数に付け替え、さらにその数層手前までを自前のデータセットで学習し直す手法。少ないデータセットで高い精度を出すことが可能。

学習済みモデルを利用するという点で転移学習に近い手法だが、違いとして出力層だけでなく全層自前のデータセットで学習し直す（チューニングする）という点が挙げられる。一般的には入力層付近の学習率は小さめに、出力層に近づくに連れて大きくしていく。

1.前処理クラス…画像をリサイズしたり反転・回転させたり標準化したりすることで、

などが期待される。
2.パスリスト作成クラス…今いる階層から自前のデータまでのアクセスルートをパスとして取得し、リスト化する。

3.データセットクラス…上記1と2を組み合わせ、（前処理済み画像,正解クラス）のタプルを作る。

4.データローダークラス…3で作成した（前処理済み画像,正解クラス）が画像枚数分あるリストから、ミニバッチサイズに応じてデータを抽出する。

5.モデルを学習させる関数…実際に学習を行う場所。