この記事の目的
ニュアンスでふんわり覚えて使っていた基本的なAI用語について説明できるようになる。
そもそもAIとMLが何なのかという話はこちら。
https://qiita.com/ei_540/items/1d59062648328a327920
深層学習(ディープラーニング)
ニューラルネットワークを使って大量のデータを学習すること。
ニューラルネットワーク
深層学習の基本になるアルゴリズム。画像認識や音声認識に使われている。
人間の脳の神経システム(ニューロン)を模してモデル化した。
入力層、隠れ層(中間層)、出力層の三種類で構成されている。
入力層でデータ(多くの場合は画像や音声などの非構造化データ)を受け取り、出力層に結果を送信する。隠れ層ではデータから結果に必要な特徴量を学習する。
アルゴリズム
問題を解くための一連の手順やルールのこと。
コンピュータビジョン
その名前の通り、コンピュータに画像等を見せて学習させること。
物体検出や顔認識に使う。
トレーニング
データを使ってモデルに学習させること。
推論
学習したモデルを新しいデータに試してみること。以下の種類がある。
- バッチ推論
- 決められた時間に定期的に処理を行う。大量のデータかつ、リアルタイムでなくても大丈夫な場合に最適
- リアルタイム推論
- その名前のとおり、入力されたデータを即座に処理する。チャットボットなど、レイテンシーが許されない要件に最適
- 非同期推論
- 転送するデータのサイズが大きく処理時間が長い、ほぼリアルタイムのレイテンシー要件があるリクエストに最適
- https://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/async-inference.html
フィット
モデルがトレーニングデータにどの程度適応しているかを示す概念。
過学習(オーバーフィッテング)
トレーニングで使用したデータを覚えすぎてしまい、新しいデータにはあまり適応できない状態。学習させるモデルが複雑なほど起きる。
未学習(アンダーフィッティング)
データを十分に学習できていない状態。シンプルにデータや学習時間が足りていない。
知識がない状態で資格を受けて全くうまくいかないのと同じ。
バイアス
実測値と推定値の差のこと。偏ったデータ等で学習させると発生しやすい。過学習の原因にもなる。
公平性
AIがすべての人間を平等に扱い、不当な偏りやヤバ思想を持たないように設計しようねーという取り組み。
透明性
どんなデータを使い、どうやって学習したのかが誰にでもはっきりとわかる状態。
いくら便利でも、誰がどうやって作ったかわからないものは安心して使えないよね…という考えから生まれた。
大規模言語モデル(Large Language Model)
大量のテキストデータで訓練された深層学習モデル。一般的にLLMと略される。
高度な言語理解機能を持ち、ChatGPTとかにも使われている。