Microsoft AI-900試験の用語をまとめた記事です。公式のLearnを参考にしています。
試験範囲と配点
- Artificial Intelligence のワークロードと考慮事項について説明する (15 から 20%)
- Azure での機械学習の基本原則について説明する (20 から 25%)
- Azure の Computer Vision ワークロードの機能について説明する (15 から 20%)
- Azure の自然言語処理 (NLP) ワークロードの機能について説明する (15 から 20%)
- Azure 上の生成系 AI ワークロードの特徴について説明する (15 から 20%)
AI基礎
人工知能の種類
- 機械学習
- 画像分析(Computer Vision)
- 自然言語処理
- ドキュメントインテリジェンス
- ナレッジマイニング
- 生成
機械学習のフロー
①データの前処理
- 欠損値処理
- 正規化
- 特徴選択
②トレーニング
説明変数(特徴量):予想するための値
目的変数(ラベル):予想したい値
- 回帰:数値を予想する(教師あり)
- 分類:カテゴリを予想する(教師あり)二項分類とマルチクラス分類がある
- クラスタリング:いくつかのグループに分類する(教師なし)
③パフォーマンス評価
すべてのデータをトレーニングに使うのではなく、評価用のデータを行を分けて残しておく
回帰のメトリック
- 平均絶対誤差
- 平均平方二乗誤差
- R2スコア
分類のメトリック
- 適合率:真予想の数のうち、本当に真だった予想の割合
- 再現率:真データのうち、正しく真だと予想できた割合
デプロイ
モデルをデプロイすることで、利用できるようになる
AzureのAIサービス
Azure Machine Jearning
- 自動ML:データをアップロードすることで、自動でモデル作成
- デザイナー:GUIで推論パイプラインにコンポーネントを配置(例:データの分割はSplit)
- Notebooks:コードでの実行が可能
Azure AI Service
構築済みのAIモデルを利用可能(自然言語解釈、画像分析など)
Azure Open AI Service
OpenAI(GPT)が使用可能
責任あるAI
6つの原則
- 公平性:偏見や差別があってはいけない
- 信頼性と安全性:フェールセーフで実行される
- プライバシーとセキュリティ:個人情報の取り扱いに注意
- 包括性:アクセシビリティがあること
- 透明性:仕組みが理解しやすいこと
- アカウンタビリティ:AIの挙動について責任を持つこと
Computer Vision(画像分析)
Azureのサービス
- Vision:画像解析、OCR、空間分析
- Face:顔検出、顔認識
Azure AI Vision
- 画像の説明
- オブジェクト検出:オブジェクトの位置を示す境界ボックスを生成
- セマンティックセグメンテーション:オブジェクトの位置をピクセル単位で検出
- OCR
- ブランド検出
- 顔検出、顔認証(顔認証には事前の申請と承認が必要)
Azure AI Custom vision
- 画像分類
- オブジェクト検出
自然言語処理
自然言語処理のステップ
- 形態素解析
- 構文解析
- 意味解析
- 文脈解析
テキストマイニング
- トークン化:テキスト内の単語をトークンに置き換え
- 頻度解析:単語の数をカウントし、出現頻度順に整理
- ベクトル化:単語の意味をベクトル化、類似度を指数化
Azureのサービス
- Lamguage:言語検出、キーフレーズ抽出、エンティティ認識、感情分析など
- Speech:テキスト読み上げ、音声テキスト変換
- Translator:テキスト翻訳、ドキュメント翻訳
Azure AI Language
- エンティティ認識:テキスト内のワードを"人、数値、日付"などのタイプ別に一覧化
- 言語判別:言語を判別(あいまいな場合NaNが返される)
- 感情分析、オピニオンマイニング:ドキュメントが肯定的か否定的かを判別
- キーフレーズ抽出:主要な要点を抽出
Azure AI Bot Service
Azureでボットを作成できる
ドキュメントインテリジェンス
Azureのサービス
Azure AI Document Intelligence:レシートから商品名、短歌、合計などの情報を読み取る
事前構築モデルが処理できるもの:
- 請求書に記載されている顧客とベンダーの詳細
- 領収書に記載されている売上とトランザクションの詳細
- ID ドキュメントに記載されている識別と検証の詳細
- 健康保険の詳細
- ビジネス連絡先の詳細
- コントラクトに記載されている契約とパーティの詳細
- 課税補償
- 住宅ローン利息、学生ローンの詳細など金融サービスと法的事項、米国の税、米国の住宅ローン、個人識別の各ドキュメント
ナレッジマイニング
Azureのサービス
Azure AI Search:ナレッジを作成可能
- インデックス作成:インデクサーによって、ドキュメントや画像データからインデックスを作成(JSON)
- クエリの実行:インデックスの内容を参照
生成AI
従来AI:インプットに対して、モデルが学習した内容に沿ってアウトプット
生成AI:インプットに対して、大量の学習データに沿ってアウトプット
Transformer:テキスト生成に使われるアーキテクチャ
- ①トークン化:テキストをトークン化
- ②埋め込み:コンテキストベクトルを定義
- ③アテンション:関係の強さを定義
モデルの例
-
GPT
-
BERT
-
LLaMA
-
大規模言語モデル:広い範囲の一般的な主題を表す膨大な量のテキストでトレーニング
-
小規模言語モデル:小規模の、特定の分野にフォーカスしたテキストでトレーニング
Azureのサービス
Azure OpenAI Service
利用可能なモデル
- o1,o1-mini:優れた推論能力を持つ最新モデル(2025/1現在)
- GPT4:自然言語とコードを理解し、生成できるモデル
- Embeddings:テキストを数値ベクトル形式に変換して、テキストの類似性を確認可能
- DALL-E:画像生成
- Wisper:音声をテキストに
- Text to Speech:テキストを音声に
入力パラメータ
- 過去のメッセージを含む
- 最大応答
- 温度
- 上位P
- プレゼンスのペナルティ
Copilot
マイクロソフトのサービスと連携したAI
Azure AI Foundry
AzureのAIサービスを1つにまとめたワークスペース(旧名称:Azure AI Studio)
責任のある生成AI
潜在的な有害性を事前に排除する
- コンテンツフィルター
- 段階的な配信