機械学習の基礎
機械学習(ML)とは
機械学習は、新しいデータに対して、自ら判断をすることができるアルゴリズムを構築すること。そのために、多くのデータを用いて、そのようなアルゴリズムの精度を高める過程が必要となる。
モデル
機械学習において、入力に対して自ら判断して出力をするアルゴリズム
また、モデルは判断に用いるそのアルゴリズムを改善する(=学習する)ことができる
トレーニング
データを入力することで、より正確な出力をするようモデルに学習させること
推論
トレーニングをしたモデルが、新しいデータに対して自ら判断を行うこと
よく似た概念の人工知能(AI)は、人間が行うタスクを実行可能な、自然知能を模倣したシステムのことで、AIを実現するテクニックのひとつが機械学習
機械学習の流れ
- データを集める
- 機械学習の目的に沿ったデータを収集
- データをモデルのトレーニングに適した形へ加工
- モデルをトレーニングする
- データを学習アルゴリズムに入力してモデルを構築
- モデルをテストする
- モデル構築での入力データを用いて、モデルの品質を評価
- モデルに推論をさせる
- モデルを使って、新しいデータに対する予測や意思決定を生成
データの収集と準備
機械学習のモデルの品質は、学習させるデータの品質に依存するので、非常に重要なプロセスになる。
ラベル付け
データのラベル付けとは、目的や正解となる出力を、ラベルとして元データに割り当てること。このラベルは、モデルにとってガイドとして機能し、パターン予測と予測機能を向上させる。
構造化データと非構造化データ
- 構造化データ
- データベースのような形式で整理やフォーマットされたデータ
- 表形式のデータや連続した一連の測定値のデータなど
- 非構造化データ
- あらかじめ定義された構造や形式がないデータ
- テキスト・画像・音声・動画などのデータ
モデル
機械学習での学習手法
3種類存在し、ユースケースによって使い分けられる。
教師あり学習
- 入力値と出力値の正解のペアがあるデータ(ラベル付きデータ)を学習させる手法
- ユースケース:
- 正解と不正解に分類する(分類)
- 連続する数値データの予測(回帰)
教師なし学習
- 大量のラベルなしデータを学習させ、それらのパターンや構造を認識させる手法
- ユースケース:
- 大量のデータをカテゴリ別にグループ化する(クラスタリング)
- データ間の関係性や規則性を見つける(レコメンデーションなど)
強化学習
- 出力結果に点数をつけて、点数が最大化する行動を考えさせる手法
- ユースケース:
- 利益が最大になる方法を見つける
- ゴールに辿り着くルートを見つける
モデルによる推論
主な推論は、以下の2種類
- バッチ推論
- ・モデルが大量のデータをまとめて分析して、一連の結果を出す推論のこと
- ・意思決定のスピード < 出力の正確さ
- リアルタイム推論
- ・入ってくる新しい情報ごとに、瞬時に結果を出す推論のこと
- ・意思決定のスピード > 大量のデータの分析
- ・チャットボットや自動運転など
深層学習
深層学習は、機械学習の手法のひとつであり、人間の脳が情報を処理する仕組みを模倣して設計された、人工ニューラルネットワークを使用する。
ニューラルネットワークとは
人間の脳は、ニューロンと呼ばれる脳細胞が相互接続されたネットワークを形成し、情報処理の際に互いに電気信号を送り合っている。人工ニューラルネットワークでは、ニューロンの代わりにノードというソフトウェアモジュールが相互接続され、3つの層を構成している。
入力層
- 人工ニューラルネットワークの外からの情報を受け取る層
- 入力層のノードは、データを次の層に渡す
隠れ層 (非表示層)
- 隠れ層は、入力層か他の隠れ層から入力を受け取り、それを処理した結果を次の層に渡す
- 深層学習とは、この層を複数所有するニューラルネットワーク(=ディープニューラルネットワーク)を利用したプロセスのことを指す
隠れ層を1つしか持たないニューラルネットワークは、シンプルニューラルネットワーク、または単にニューラルネットワークと呼ばれる。
出力層
- 人工ニューラルネットワークにおける、すべてのデータ処理の最終結果を示す層
- 最終結果がバイナリ(0 or 1)の場合、出力層には1つの出力ノードがあり、0または1を示す
- 対して、複雑な結果となる場合では、複数の出力ノードで構成されることもある
ニューラルネットワークの仕組み
ニューラルネットワークの各ノードには、重みとしきい値というパラメータがある。それらを調整することで、出力結果を最適化していく。
重み
- ノードが受け取る各入力値ごとに調整された、入力値に乗算する係数
- 重みが大きい入力値ほど、出力値に大きな影響を与える
- したがって、重みはその入力値の重要度を表すと言える
しきい値
- 出力結果を判断するために、各入力値に重みをつけた値の合計と比較される基準値のようなもの
- 最も単純なアルゴリズムなら、
- 各入力値に重みをつけた値の和 ≧ しきい値 → 1を出力
- 各入力値に重みをつけた値の和 < しきい値 → 0を出力
ニューラルネットワークの学習
= 出力結果が正しくなるよう、重みとしきい値を調整する作業
※重みとしきい値に関する分かりやすい例が記載↓
ニューラルネットワークの代表的な種類
-
フィードフォワードニューラルネットワーク
- すべてのノードが、次の層のすべてのノードに接続される
- 入力ノードから出力ノードという一方向の流れでデータを処理
- 単純で基本的な構造であり、深層学習の基礎的なアーキテクチャ
- 入力データが独立しているため、時系列データや連続性のあるデータには不向き
-
バックプロパゲーションアルゴリズム
- フィードバックループを使用して学習することで、予測を改善するという学習アルゴリズム
- ノードは、推測結果が間違っていた場合は、重みの大きいノードの重みを修正し、正しかった場合はその接続のノードに高い重みを割り当てる
- 上記のフィードバックを、出力側から入力側の層へと伝播させていく
-
畳み込みニューラルネットワーク
- 隠れ層が畳み込みという数学的関数を実行する
- 画像の分類によく使われる
参考サイト
その他の語句
- 不確実性
- モデルの出力が不完全である度合い
- 説明可能性
- モデルの出力の根拠が、人間の言葉で説明できること
- ハルシネーション
- AIが事実と異なる、間違った情報を生成すること