AI(機械学習の全体像)
教師あり学習と教師なし学習
教師あり学習と教師なし学習の違いは主にラベルの有無にあります。
教師あり学習:
- データセットが「入力データ」と「正解ラベル」のペアで構成されています。
- ゴールは、与えられた入力に対して正しいラベルを予測するモデルを構築することです。
- 例:画像に写っている物体の名前を予測する。
教師なし学習:
- データセットにラベルが付与されていない。
- アルゴリズムはデータのパターンや構造を見つけ出すことが目的です。
- 例:顧客データから類似のグループを見つけ出すクラスタリング。
強化学習:
- エージェントが環境と相互作用し、行動に基づいて報酬を受け取ることで学習します。
- ゴールは最大の累積報酬を獲得する戦略を見つけることです。
- 例:ビデオゲームでの最適なプレイ戦略を学習する。
ニューラルネットワーク
ニューラルネットワークはデータから学習するためのアルゴリズムの基本単位で、単層または少数の層からなることがあります。
ディープラーニング
ディープラーニングは、多層(ディープ)ニューラルネットワークを使用する機械学習の一分野です。
この「ディープ」という用語は、隠れ層が多いことを指し、より複雑で抽象的な特徴をデータから学習する能力が向上しています。
生成AIとLLM
生成AI:
新しいコンテンツやデータを生成する技術を指します。これにはテキスト、画像、音楽などが含まれることがあります。生成AIは、学習したデータをもとに新しいデータを生成することで様々なアプリケーションに利用されます。
LLM(Large Language Models):
これは特に大規模なテキストデータセットから学習した言語モデルを指します。GPTやBERTなどが有名です。これらは主にテキスト生成や自然言語理解のタスクに使用され、非常に多くのパラメータを持つことが特徴です。
主な技術には、ディープラーニング、特にトランスフォーマーアーキテクチャが含まれます。これは自己注意(self-attention)メカニズムを利用し、大量のテキストデータを解析して文脈的な関連を学習します。これにより、テキスト生成、翻訳、要約などの複雑なタスクを効率的に処理できるようになります。
生成AIは幅広いタイプのデータを扱い、LLMは特に言語データに特化した生成AIの一種と考えることができます。

