概要
AI-102を一発合格しました。
点数は730/1000点。
勉強期間は約3日間でした。勉強記録はすべて以下に残しています。
参考
勉強に使用した内容
Microsoft Practice
Microsoft Learning
模擬試験ログ
模擬試験4
模擬試験3
模擬試験2
回数: 2回目
日付: 2025/1/29
点数: 100%
模擬試験1
Microsoft Practice
Azure AI Video Indexer とは?
Azure AI Video Indexer は、動画コンテンツを分析し、さまざまなメタデータ(顔認識、音声、テキスト、シーン検出など)を自動で抽出する AIベースの動画解析ソリューション です。
簡単に言うと、動画の中身を「見て」「聞いて」「理解して」、検索しやすく整理するツール です。
主な機能
1. 顔認識(Face Detection)
- 動画内の人物を識別し、同一人物を追跡。
- 既知の人物との照合機能。
2. 音声解析(Speech-to-Text & Sentiment Analysis)
- 音声の自動文字起こし(字幕生成可能)。
- 発言内容の感情分析(ポジティブ/ネガティブなど)。
3. オブジェクト認識(Object Detection)
- 動画内の特定の物体(車、建物、人物など)を自動検出。
4. シーンとショットの検出(Scene & Shot Detection)
- シーンの切り替わりを検出し、チャプター分け。
5. OCR(文字認識)
- 動画内の看板や字幕などの文字を認識し、データ化。
6. 翻訳と多言語対応
- 動画の音声やテキストを自動翻訳し、複数の言語に対応。
7. コンテンツのモデレーション
- 不適切なコンテンツ(暴力・卑猥な表現など)の自動検出。
活用例
- メディア・エンタメ業界 → 動画アーカイブの整理、検索性の向上
- マーケティング → 動画コンテンツの解析&ターゲティング
- 監視カメラ映像の分析 → 事件発生時の顔認識や異常検出
- 教育機関 → 講義ビデオの字幕作成・検索機能の強化
使い方の流れ
- 動画をアップロード(Azureポータル、API、SDK経由)
- AIによる自動解析(メタデータの抽出)
- 結果を確認・検索(ポータルやアプリで活用)
- データをエクスポート・共有
導入のメリット
- 手間の削減 → 手動でのタグ付けや検索作業を大幅に短縮
- データ活用の強化 → 動画コンテンツの利活用を促進
- セキュリティとコンプライアンス対応 → 不適切なコンテンツの検出
関連サービスとの連携
- Azure Cognitive Services(顔認識、翻訳、音声認識と連携)
- Azure Media Services(動画のストリーミング・管理と併用)
まとめ
Azure AI Video Indexer は、動画の中身を 自動で解析し、ビジネスや研究に役立つメタデータを提供する便利なツール です。
Azure OpenAI Service とは?
Azure OpenAI Service は、Microsoft Azure 上で OpenAI の強力な AI モデル(GPT-4、Codex、DALL·E など) を活用できるクラウドサービスです。
これにより、文章生成、要約、翻訳、コード補完、画像生成 などの高度な AI 機能を、セキュリティとスケーラビリティを兼ね備えた環境で利用できます。
主な特徴
1. 強力なAIモデルを利用可能
Azure 上で以下の OpenAI モデルを利用できます:
- GPT-4 / GPT-3.5:高度な自然言語処理(文章生成、要約、チャットボットなど)
- Codex:プログラミングコードの補完や自動生成
- DALL·E:テキストから画像を生成
2. エンタープライズ向けのセキュリティと管理機能
Azure の セキュリティ基準 に準拠し、データのプライバシーと保護を保証。
- ネットワークセキュリティ(VNET 統合、IP制限)
- アクセス管理(RBAC、Azure AD 連携)
- コンプライアンス対応(GDPR、ISO、SOC など)
3. Azureサービスとの統合が容易
Azure の他のサービスとスムーズに連携し、AI をビジネスに簡単に導入可能。
- Azure Cognitive Services(翻訳、音声認識などと連携)
- Azure Logic Apps(自動ワークフローの構築)
- Power BI(生成されたデータの可視化)
4. カスタムモデルのチューニング
事前学習済みの OpenAI モデルに対して、独自のデータを用いた ファインチューニング が可能。
これにより、特定のビジネスニーズに最適化された AI ソリューションを構築できます。
活用例
Azure OpenAI Service は、さまざまな分野で活用されています:
- カスタマーサポートの自動化 → チャットボットや FAQ の生成
- マーケティング支援 → 広告コピーやコンテンツの自動生成
- プログラミング支援 → コード補完やドキュメント作成の自動化
- データ分析レポート作成 → 複雑なデータを簡潔に要約
- 画像コンテンツの生成 → 広告やデザイン素材の作成
使い方の流れ
-
Azure ポータルでサービスを作成
- 「Azure OpenAI」を検索し、リソースをデプロイ
-
モデルの選択と設定
- GPT-4 や Codex などのモデルを選択し、エンドポイントを取得
-
API を使用してアプリケーションに統合
- Python や Node.js などの SDK を利用して API を実装
-
パフォーマンスの最適化とスケーリング
- 必要に応じてモデルのファインチューニングやスケール調整
導入のメリット
- 迅速な導入 → Azure 環境で簡単に AI を利用可能
- スケーラビリティ → ビジネスの成長に応じた拡張が可能
- コスト効率 → 必要なリソースに応じた料金体系
コストについて
Azure OpenAI Service は、使用するモデルや処理量に応じた 従量課金制 です。
例えば、GPT-4 は高精度な分、コストも高くなるため、用途に応じたモデル選択が重要です。
関連サービスとの連携
- Azure Machine Learning → 機械学習モデルとの組み合わせ
- Power Automate → 業務プロセスの自動化
- Azure Bot Service → AI チャットボットの構築
まとめ
Azure OpenAI Service を使えば、最先端の AI モデルを セキュアかつスケーラブルに利用 できます。
ビジネスの自動化や新しいアイデアの実現に最適なプラットフォームです。
AIエンリッチメントって何?
AIエンリッチメントとは、「データにAIの力を使って、新しい情報を追加したり、もっと使いやすく整理したりすること」 です。
例えば、あるデータがあったとします。
名前 | 住所 |
---|---|
田中太郎 | 東京都新宿区 |
鈴木花子 | 大阪府大阪市北区 |
このデータをAIで「エンリッチ(豊かに)」すると、以下のように役立つ情報を追加できます。
名前 | 住所 | 都道府県 | 市区町村 | 緯度・経度 |
---|---|---|---|---|
田中太郎 | 東京都新宿区 | 東京都 | 新宿区 | 35.6895, 139.6917 |
鈴木花子 | 大阪府大阪市北区 | 大阪府 | 大阪市北区 | 34.6937, 135.5023 |
こうすることで、例えば「地図に表示する」とか、「都道府県別にデータをまとめる」といったことが簡単にできるようになるよ!
どんな場面で使われるの?
AIエンリッチメントは、いろんな場面で役立っています。例えば…
-
ショッピングサイト
- 商品のレビューに「ポジティブ・ネガティブ」のタグを自動でつける
- 画像から商品の種類(服、靴、バッグなど)を判別
-
会社のデータ整理
- 顧客データから「年代」や「よく買う商品」をAIが分類
- 住所から最寄りの店舗を自動で表示
-
学校の資料検索
- 膨大な資料から「キーワード」を自動抽出して、検索しやすくする
具体的に何ができるの?(機能例)
AIエンリッチメントでは、以下のような機能が使えます。
1. テキスト解析(自然言語処理)
文章を読み取って、意味を理解したり、重要な単語を抽出します。
例:
- レビューから「感情分析」→ ポジティブ・ネガティブの判定
- ニュース記事から「会社名」や「日付」を自動抽出
2. 画像解析(コンピュータビジョン)
画像から内容を自動認識して、タグや説明をつけます。
例:
- 写真から「動物」「車」などを識別
- 手書き文字をデジタルデータに変換
3. 音声認識
音声をテキストに変換して、文字検索しやすくします。
例:
- 会議の録音を文字に起こして、議事録を作成
- 動画のセリフを自動で字幕に変換
Azure AI エンリッチメントとは?
Microsoft Azure には 「Azure AI Enrichment」 というサービスがあり、AIを使って簡単にデータをエンリッチ(豊かに)することができます。
例えば、以下のようなAI機能を組み合わせて使えます:
- 画像の分析 → 画像から文字を読み取る(OCR)
- テキストの分析 → 感情分析、キーワード抽出
- 翻訳 → 自動で複数の言語に変換
これらの機能を使って、例えば「大量の書類や画像をスキャンして、検索しやすくする」といった作業が自動化できます。
どうやって使うの?(基本の流れ)
AIエンリッチメントの流れはこんな感じ!
- データを準備(文章、画像、音声など)
- AIを適用(テキスト解析、画像認識などの機能を実行)
- 結果を取得(整理されたデータを活用)
Azure を使えば、これらの処理をクラウド上で簡単に実行できます!
まとめ
- AIエンリッチメント とは、AIを使ってデータを「より便利に、わかりやすく」する技術。
- 文章、画像、音声 などのデータに対して、さまざまな情報を追加できる。
- Microsoft の Azure AI Enrichment を使えば、簡単にデータの整理・活用ができる。
Azure AI Vision と Azure AI Custom Vision の違い
Microsoft Azure には、画像や映像の解析を行う2つの主要なサービスがあります:
- Azure AI Vision(旧 Computer Vision)
- Azure AI Custom Vision
どちらも画像認識に関連するサービスですが、目的や使い方に違いがあります。以下にそれぞれの特徴と違いを説明します。
1. Azure AI Vision とは?
Azure AI Vision は、Azureが提供する 汎用的な画像認識サービス です。すでに学習済みのAIモデルを利用して、さまざまな画像や動画データを分析できます。
主な機能
- 画像解析 → 画像から「オブジェクト」「色」「カテゴリ」「顔」「テキスト」などを自動で検出。
- OCR(光学文字認識) → 画像の中の文字を読み取り、テキストデータとして抽出。
- 画像の説明生成 → AIが画像の内容を文章で説明。
- 顔検出 → 画像から顔の位置や属性(年齢、性別、感情)を識別。
- 有害コンテンツの検出 → アダルトや暴力的なコンテンツを判別。
メリット
- すぐに利用可能(モデルの事前学習済み)。
- コーディングなしでAzureポータルから簡単に試せる。
- 特別なカスタマイズなしで、一般的な用途に幅広く対応。
デメリット
- 特定のビジネス用途に特化したカスタマイズはできない。
- モデルの学習ができないため、自社データに最適化できない。
2. Azure AI Custom Vision とは?
Azure AI Custom Vision は、ユーザーが独自のデータを使って カスタム画像認識モデルを作成・トレーニング できるサービスです。
主な機能
- カスタムモデルのトレーニング → 自社の画像データを使って、特定の物体を認識するモデルを作成。
- 分類モデル → 画像を特定のカテゴリに分類(例:犬・猫・鳥の分類)。
- オブジェクト検出 → 画像の中の特定の物体の位置を特定(例:製品パーツの認識)。
- 継続的なモデル改善 → 追加のデータを使ってモデルを再学習し、精度を向上。
- エッジデバイス対応 → 学習したモデルをIoTデバイスやオンプレミス環境で利用可能。
メリット
- 自分のビジネスに合わせた独自の画像分類や検出が可能。
- 少ないデータセットでもAIをトレーニング可能。
- モデルのチューニングができ、精度を向上させられる。
デメリット
- 学習データの収集とラベリングが必要。
- トレーニングやデプロイに手間と時間がかかる。
3. Azure AI Vision と Custom Vision の比較表
項目 | Azure AI Vision | Azure AI Custom Vision |
---|---|---|
用途 | 汎用的な画像解析 | 特定のニーズに特化したモデル構築 |
学習の必要性 | 不要(事前学習済みモデル) | 必要(ユーザー独自データを使用) |
精度のカスタマイズ | できない | できる |
主な機能 | OCR、顔認識、オブジェクト検出など | 画像分類、オブジェクト検出 |
導入のしやすさ | 簡単(すぐに使える) | 中程度(データ準備が必要) |
利用例 | 監視カメラの映像解析、一般的な画像分析 | 製品識別、医療画像解析、異常検知 |
デプロイ先 | クラウドのみ | クラウド&エッジデバイス対応 |
4. どちらを選ぶべき?
Azure AI Vision を選ぶ場合
- すぐにAIの画像認識を試したい場合。
- カスタマイズ不要で、汎用的な解析をしたい場合。
- OCRや顔認識など、一般的な機能を利用したい場合。
例:
- 画像からテキストを抽出して文書管理したい
- 監視カメラ映像から物体検出をしたい
- SNSの画像から有害コンテンツを自動判別したい
Azure AI Custom Vision を選ぶ場合
- 自分のビジネスに特化した画像分類や検出をしたい場合。
- AIモデルの学習・カスタマイズをしたい場合。
- より高い精度を求め、自社データを活用したい場合。
例:
- 工場の製品ラインで不良品を検出したい
- 医療画像を解析して疾患を特定したい
- 特定の動物や物体を分類したい
5. まとめ
- Azure AI Vision → すぐに使える汎用的な画像認識サービス(カスタマイズなし)。
- Azure AI Custom Vision → 自社のニーズに合わせてカスタムモデルを作成可能(精度調整が可能)
Conversational Language Understanding (CLU) とは?
Conversational Language Understanding (CLU) は、Azure AIのサービスの一つで、会話の内容を理解し、「インテント(意図)」や「エンティティ(情報)」を抽出 する機能です。チャットボットや音声アシスタントに活用され、ユーザーの発話を適切に解釈し、応答の自動化に役立ちます。
主な機能
- インテント識別:「ピザを注文したい」→「注文」
- エンティティ抽出:「明日の東京の天気」→「日付:明日」「場所:東京」
- センチメント分析:発話の感情を分析(ポジティブ/ネガティブ)
CLUは、簡単にカスタムモデルを作成でき、特定のビジネスニーズに対応できます。