0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

AI-102試験対策 完全勉強ノート

Posted at

AI-102試験対策 完全勉強ノート

Microsoft公式ドキュメントに基づく包括的な学習資料についてざっくりまとめました。
参考程度にこちらに公開します。

1. AIエージェントのグランディング(Grounding)

基本概念

グランディングは、大規模言語モデル(LLM)が独自のデータソースから関連情報を取得し、その情報に基づいて正確な回答を生成する技術です。RAG (Retrieval Augmented Generation) パターンの中核概念として、モデルのトレーニングやファインチューニング不要で独自データを活用できます。

動作フロー:

  1. ドキュメントをチャンク(1,024トークン)に分割しインデックス化
  2. ユーザー質問から複数の検索意図を生成
  3. 関連ドキュメントチャンクを取得
  4. 厳密度設定で無関係ドキュメントを除外
  5. チャンクを再ランク付け
  6. 選択コンテキストでLLMが最終回答生成

実装方法

completion = client.chat.completions.create(
    model=deployment,
    messages=[{"role": "user", "content": "質問"}],
    extra_body={"data_sources": [{
        "type": "azure_search",
        "parameters": {
            "endpoint": search_endpoint,
            "index_name": search_index,
            "strictness": 3,
            "top_n_documents": 5
        }
    }]}
)

試験対策ポイント

  • RAGパターン実装、データソース選択、検索タイプ(Keyword/Semantic/Vector/Hybrid)、パラメータ調整(strictness: 1-5、topNDocuments: 3-20)、Azure AI Search統合、マネージドID認証

2. Agent Serviceのfunction機能

基本概念

AIモデルが外部関数やAPIを呼び出せる機能。GPT-3.5-turbo/GPT-4が会話コンテキストから自動的に関数呼び出しを判断し、JSON形式で関数名と引数を返します。モデルは呼び出しを生成するのみで、実行は開発者が制御します。

実装方法

tools = [{
    "type": "function",
    "function": {
        "name": "get_current_time",
        "description": "Get current time in location",
        "parameters": {
            "type": "object",
            "properties": {
                "location": {"type": "string", "description": "City name"}
            },
            "required": ["location"]
        }
    }
}]

試験対策ポイント

  • 関数定義(JSON Schema)、tool_choiceパラメータ(auto/none/関数名)、並列関数呼び出し、APIバージョン変更(functions→tools)、Assistants API(requires_actionステータス)、セキュリティ実装

3. Azure AI LanguageのPII検出

基本概念

機械学習で入力データから機密情報を識別・編集するAPI。150種類以上のグローバルPIIエンティティを検出し、3つの編集ポリシー(DoNotRedact/MaskWithCharacter/MaskWithEntityType)を提供します。

主要PII属性

個人情報: Person, Age, DateOfBirth, Address, Email, PhoneNumber, IPAddress, URL
金融: CreditCardNumber, BankAccountNumber, ABARoutingNumber, SWIFTCode
日本固有: JPMyNumberPersonal/Corporate, JPDriversLicenseNumber, JPPassportNumber, JPResidenceCardNumber, JPSocialInsuranceNumber

実装方法

{
  "kind": "PiiEntityRecognition",
  "parameters": {
    "piiCategories": ["Person", "Email", "PhoneNumber"],
    "redactionPolicy": {"policyKind": "MaskWithEntityType"}
  }
}

試験対策ポイント

  • Named Entity Recognition(NER)概念、piiCategoriesパラメータ、編集ポリシー3種、REST API/SDK使用、Azure AI Search統合(cognitive skill)

4. Intent(意図)とEntity(エンティティ)

基本概念

Intentはユーザーが実行したいアクション(フライト予約、天気確認)、Entityはアクションに必要なパラメータ(目的地、日付)を表します。

CLU vs LUIS

CLU (推奨): LUIS後継、高精度MLモデル、多言語、Speech SDK 1.25+対応
エンティティコンポーネント: Learned(ML学習)、List(固定セット)、Prebuilt(数字・日時)、Regex(パターン)

Speech Pattern Matching

エンティティ種類:

  • Any Entity: 任意テキストマッチ(lazy matching)
  • List Entity: Strict/Fuzzyモード
  • PrebuiltInteger: 整数期待、文字列返却

試験対策ポイント

  • CLU実装、エンティティコンポーネント組み合わせ、Pattern Matching使用場面、Speech SDK統合、Intent recognition(2025年9月30日廃止)、エンティティロール

5. Azure AI Searchの認知スキル

基本概念

AIエンリッチメントパイプラインのコンポーネント。生コンテンツを検索可能な構造化データに変換する19種類のスキル。

主要スキル

Azure AI課金: KeyPhraseExtraction, LanguageDetection, EntityRecognition(14種), EntityLinking, PIIDetection, Sentiment, Translation, ImageAnalysis, OCR, VectorizeSkill, DocumentIntelligenceLayout
Azure OpenAI: AzureOpenAIEmbedding
ユーティリティ(無課金): Conditional, DocumentExtraction, Merge, Shaper, Split
カスタム: WebApiSkill, AmlSkill

パイプラインフロー

Data Source → Indexer → Skillset → Enriched Document → Index/Knowledge Store

試験対策ポイント

  • スキルセット作成、スキルコンテキスト設定(/document, /document/pages/*)、フィールドマッピング vs 出力フィールドマッピング、エンリッチメントツリー概念、OCR+Text Merge実装、Knowledge Storeプロジェクション

6. Document Intelligenceモデルタイプ

基本概念

3つのモデルタイプ: 事前構築済み(Microsoft提供)、カスタム(ユーザートレーニング)、構成済み(複数モデル結合)

事前構築済みモデル

ドキュメント分析: Read, Layout
金融・法務: Invoice, Receipt, Contract, BankCheck, BankStatement, PayStub, CreditCard
個人識別: IDDocument, HealthInsuranceCard, MarriageCertificate, BusinessCard
米国税務: W-2, W-4, 1040, 1095, 1098, 1099シリーズ
住宅ローン: 1003(URLA), 1004(URAR), 1005, 1008, 決算開示

カスタムモデル

カスタムテンプレート: 構造化向け、トレーニング1-5分、最小5サンプル、最大500ページ/50MB
カスタムニューラル: 非構造化対応、トレーニング20-60分、最大50,000ページ/1GB
カスタム分類: ドキュメントタイプ識別、最小2クラス、クラスごと5サンプル

構成済みモデル(v4.0)

最大500モデル結合、明示的分類、信頼度ルーティング、アドオン機能サポート

試験対策ポイント

  • モデルタイプ違い、トレーニング要件(最小5サンプル)、データ制限、Document Intelligence Studio使用、REST API/SDK実装、使い分け基準

7. Azure OpenAI - DALL-E

基本概念

テキストプロンプトから画像生成。DALL-E 2(1024x1024のみ)、DALL-E 3(3サイズ、style/quality設定)、GPT-image-1(最新、要承認、ストリーミング対応)

主要機能

DALL-E 3: サイズ(1024x1024/1792x1024/1024x1792)、スタイル(natural/vivid)、品質(standard/hd)
GPT-image-1: 品質(low/medium/high)、形式(PNG/JPEG)、圧縮(0-100)、画像編集APIサポート

実装方法

result = client.images.generate(
    model="dalle3",
    prompt="A futuristic cityscape with flying cars",
    size="1024x1024",
    quality="hd",
    style="vivid"
)

プロンプトエンジニアリング

詳細で具体的に記述、スタイル/媒体指定(watercolor painting/photorealistic)、構図(aerial view/close-up)、照明/雰囲気(soft lighting/dramatic)

試験対策ポイント

  • リソースプロビジョニング、モデルデプロイ、API呼び出し(REST/SDK)、パラメータ設定、コンテンツフィルタリング(contentFilterエラー)、認証(APIキー/Microsoft Entra ID)

8. OpenAI On Your Data厳密度設定

基本概念

**Strictness(1-5)**は検索ドキュメントのフィルタリング積極性を制御。Azure AI Searchと統合してRAGパターン実装。

厳密度レベル

1: 最小フィルタリング、3(デフォルト): バランス、5: 非常に厳格、高類似性のみ

ワークフロー

  1. インテント生成→2. AI Search検索→3. Strictnessフィルタリング→4. 再ランキング→5. topNDocuments選択→6. レスポンス生成

検索タイプ

Keyword(無料、高速)、Semantic(有料、意味理解、12言語)、Vector(有料、埋め込み)、Hybrid+Semantic(推奨、最高品質)

Strictness vs AI Search

Strictness: 検索後フィルタリング(LLM入力品質)
AI Search Relevance: 検索中ランキング(検索結果品質)

試験対策ポイント

  • データソース種類(AI Search/Blob/Upload/URL)、ランタイムパラメータ(strictness/topNDocuments/inScope)、トラブルシューティング(回答不完全→strictness下げる、無関係情報→上げる)

9. Azure CLIコマンド

基本構造

az cognitiveservices [category] [action] [parameters]

主要コマンド

リソース管理:

  • create: リソース作成(--name, --resource-group, --kind, --sku, --location必須)
  • show: 情報表示(--name myresource --resource-group cognitive-services-resource-group)
  • list: 一覧表示
  • update: 更新(SKU/タグ)
  • delete: 削除(soft delete)

キー管理:

  • keys list: 認証キー取得
  • keys regenerate: キー再生成(--key-name Key1/Key2)

デプロイメント(OpenAI):

  • deployment create: モデルデプロイ(--deployment-name, --model-name, --model-version)
  • deployment list/show/delete

ネットワーク:

  • network-rule add: IPアドレス/VNetサブネット追加
  • network-rule list/remove

ID管理:

  • identity assign/show/remove: マネージドID

実装例

# AIサービス作成
az cognitiveservices account create \
  --name my-ai-service \
  --resource-group ai-services-rg \
  --kind AIServices \
  --sku S0 \
  --location eastus \
  --yes

# キー取得
az cognitiveservices account keys list \
  --name my-ai-service \
  --resource-group ai-services-rg

# OpenAIモデルデプロイ
az cognitiveservices account deployment create \
  --name my-openai \
  --resource-group ai-rg \
  --deployment-name gpt-35-turbo \
  --model-name gpt-35-turbo \
  --model-version "0301" \
  --sku-name Standard \
  --sku-capacity 10

試験対策ポイント

  • 高頻度コマンド(create/show/keys list/deployment create)、--kind値(AIServices/Face/ComputerVision/OpenAI)、--sku(F0無料/S0標準)、マネージドID、ネットワークルール、soft delete vs purge

10. Content Safetyカスタムカテゴリ

基本概念

組織固有コンテンツモデレーションルール定義。標準4カテゴリ(Hate/Violence/Sexual/Self-Harm)で対応できない組織特有ポリシーに対応。

2つの実装方式

標準API: MLモデルトレーニング、5-10時間、テキストのみ、高品質
急速API: 軽量分類器+埋め込み検索、迅速、テキスト+画像対応

主要機能

独自カテゴリ定義、サンプルトレーニング(50-5,000ポジティブサンプル)、LLMデータ拡張、バージョン管理(最大3バージョン)

実装フロー

# 1. カテゴリバージョン作成
curl -X PUT "<endpoint>/contentsafety/text/categories/<name>?api-version=2024-09-15-preview" \
-d '{"categoryName":"survival-advice","definition":"...","sampleBlobUrl":"..."}'

# 2. ビルド開始
curl -X POST "<endpoint>/contentsafety/text/categories/<name>:build?version=1"

# 3. 分析実行
curl -X POST "<endpoint>/contentsafety/text:analyzeCustomCategory" \
-d '{"text":"...","categoryName":"survival-advice","version":1}'

標準 vs カスタム

標準: 4カテゴリ固定、重大度0-7、事前定義、トレーニング不要
カスタム: 最大3カテゴリ、ブール値、独自定義、トレーニング必要(5-10時間)

試験対策ポイント

  • 制限(ユーザーごと3カテゴリ、カテゴリごと3バージョン、サンプル50-5,000)、標準APIとの違い、ブロックリスト比較、Azure Blob Storage統合、マネージドID/RBAC

11. Video Indexerカスタム言語モデル

基本概念

Microsoft Custom Speech統合で自動音声認識カスタマイズ。ドメイン固有語彙提供で文字起こし精度向上。追加料金なし。

利点

業界特有用語認識、ブランド名/製品正確認識、技術用語処理、コンテキスト認識、精度向上

カスタマイズ方法

方法1: トランスクリプト編集(自動) - Video Indexer生成トランスクリプトを編集、自動的に"From transcript edits"ファイルに記録
方法2: テキストファイルアップロード(手動) - UTF-8 BOM、1行1文、最大200MB、完全な文推奨

実装手順(Portal)

  1. Content model customization→Language→Add model
  2. Add fileでテキストファイルアップロード
  3. 緑のTrainボタンでトレーニング(数分)
  4. Upload/Re-index時にVideo source languageからカスタムモデル選択

実装手順(API)

DELETE/PUT /Accounts/{accountId}/Customization/Language/{languageModelId}
POST /Accounts/{accountId}/Videos (languageModelIdパラメータ)
PUT /Accounts/{accountId}/Videos/{videoId}/Index (再インデックス)

制限事項

Classicアカウント非サポート、デフォルト不使用(明示選択必要)、作成後データセット変更不可、言語サポート違い

試験対策ポイント

  • Custom Speech統合、2つのカスタマイズ方法、ファイル要件(UTF-8 BOM/200MB/1行1文)、使用ケース認識、Portal/API実装、アカウント固有モデル、制限理解

試験準備総括

AI-102試験範囲(2025年4月30日以降)

  • Azure AIソリューション計画・管理 (15-20%)
  • 生成AIソリューション実装 (10-15%)
  • コンピュータービジョン (10-15%)
  • 自然言語処理 (25-30%)
  • ナレッジマイニング・Document Intelligence (10-15%)
  • 生成AI最適化・運用 (10-15%)

学習推奨アプローチ

  1. 実践経験: Azure portalで各サービス実装
  2. Microsoft Learn: 公式ラーニングパス完了(約30時間)
  3. ハンズオン: 各トピックのコーディング実践
  4. ドキュメント: 日本語公式ドキュメント熟読
  5. 模擬試験: プラクティス評価で知識確認

重要な実装パターン

  • RAG実装(grounding)、Function calling、PII検出統合、Intent/Entity処理、Cognitive skillsパイプライン、Document Intelligence分析、DALL-E画像生成、CLI自動化、Content Safety統合、Video Indexerカスタマイズ

このノートは、Microsoft公式日本語ドキュメントに基づき、AI-102試験の全11トピックを網羅した包括的な学習資料です。各トピックは基本概念、実装方法、試験対策ポイント、実務活用シーンを含みます。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?