分類と回帰の用語
| 用語 | 意味 |
|---|---|
| サンプル or 入力 | モデルに渡される1つのデータ |
| 予測値 or 出力 | モデルから返される値 |
| 目的値 | 真の値。外部のデータに基づいてモデルが予測すべき値 |
| クラス | 分類問題において選択可能な一連のラベル |
| ラベル | 分類問題でのクラスアノテーションのインスタンス |
| グラウンドトルース or アノテーション | データセットの全ての目的値 |
| 二値分類 | 入力サンプルを2つの相互吐いたなカテゴリに分類するタスク |
| 多クラス分類 | MNSITのような2つ以上のカテゴリに分類するタスク |
| 多ラベル分類 | 各入力サンプルに複数のラベルを割り当てる分類タスク |
| スカラー回帰 | 目的値が連続するスカラー値となるタスク ※価格予測問題など |
| ベクトル回帰 | 連続ベクトルなど、目的値が連続値となるタスク※画像の境界矩形の座標など |
| ミニバッチ or バッチ | モデルがデータを処理する際の処理単位 |
### 最終レイヤーの活性化関数と損失関数
| 問題の種類 | 活性化関数 | 損失関数 |
|---|---|---|
| 二値分類 | sigmoid | binary_crossentropy |
| 多クラス単一ラベル分類 | sogtmax | categorical_crossentropy |
| 多クラス多ラベル分類 | sigmoid | binary_crossentropy |
| 任意の値に対する回帰 | - | mse |
| 0 ~ 1の値に対する回帰 | sigmoid | mse or binary_crossentropy |
| 機械学習で何をしたいかによって最終レイヤーの出力形式が変わる | ||
| 損失関数も変わる |
レイヤー:ディープラーニングの構成要素
データ形状によって選択すべきモデルのアーキテクチャが異なる
| データ形状 | 選択されるレイヤータイプ | Keras クラス |
|---|---|---|
| 2次元テンソル | 全結合層 | Denseクラス |
| 3次元テンソル | LSTM層などのリカレント層 | https://keras.io/ja/layers/recurrent/ |
| 多クラス多ラベル分類 | 2次元の畳み込み層(Conv2D) | |
| 機械学習で何をしたいかによってデータの形状は変わる | ||
| そして、データの形状によって最適なレイヤーが変わる | ||
| レイヤーのタイプが変わればデータの渡し方も変わる |