Azure AI Fundamentals (AI-900) 学習ガイド Part 2: Azure AI Services
Part 1では、AIの基本概念について見てきました。
続くPart 2では、実際にAzureが提供しているAIサービスにはどのようなものがあるのか、そしてそれらがビジネスの現場でどのように役立つのかを具体的に解説していきます。
1. Computer Vision (コンピュータービジョン)
画像を処理し、情報を抽出するためのサービス群です。
Azure AI Vision
- 画像分析 (Image Analysis): 画像内のオブジェクト、ブランド、タグ、説明文などを自動的に識別します。
- 顔認識 (Face API): 顔の検出、識別、感情分析を行います。
- OCR (光学文字認識): 画像内のテキストを読み取ります (Read API)。
Custom Vision
- 画像分類 (Image Classification): 画像全体にラベルを付けます(例:「犬」か「猫」か)。
- 物体検出 (Object Detection): 画像内の特定のオブジェクトの位置(バウンディングボックス)とクラスを特定します。
2. Natural Language Processing (NLP)
テキストや音声を処理するためのサービス群です。
Azure AI Language
- 感情分析 (Sentiment Analysis): テキストがポジティブかネガティブかを判定します。
- キーフレーズ抽出 (Key Phrase Extraction): テキスト内の重要なポイントを抽出します。
- 固有表現認識 (NER): 人名、場所、組織などのエンティティを識別します。
- 質問応答 (Question Answering): ドキュメントに基づいて、ユーザーの質問に回答します。
Azure AI Speech
- Speech-to-Text: 音声をテキストに変換します(文字起こし)。
- Text-to-Speech: テキストを自然な音声に変換します(読み上げ)。
- Speech Translation: 音声をリアルタイムで多言語に翻訳します。
Azure AI Translator
- テキストを複数の言語間で翻訳します。
3. Document Intelligence & Knowledge Mining
Azure AI Document Intelligence (旧 Form Recognizer)
機械学習を使用して、ドキュメント(請求書、領収書、IDカード、フォームなど)からテキスト、キーと値のペア、表、構造を抽出します。
Azure AI Search (旧 Cognitive Search)
Web、モバイル、エンタープライズアプリケーション向けのAI搭載クラウド検索サービスです。
- インデクサー: データを自動的にクロールします。
- コグニティブスキル: 画像やテキストの処理(OCR、翻訳など)をインデックス作成プロセスに組み込み、検索可能にします。
4. Generative AI (生成AI)
プロンプトに基づいて新しいコンテンツを作成するAIです。
Azure OpenAI Service
OpenAIの強力なモデルをAzure上で利用できます。
- GPT-4: 自然言語の生成、要約、翻訳、コード生成。
- DALL-E: テキストプロンプトからの画像生成。
- Playgrounds: モデルを試したり、プロンプトを調整したりできるWebベースのインターフェース。
Copilot
Microsoft製品(GitHub, Microsoft 365など)に統合されたAIアシスタント。
重要な概念
- プロンプト (Prompt): AIに対する入力(指示)。
- トークン化 (Tokenization): テキストをモデルが処理できる単位(トークン)に分割すること。
- 温度 (Temperature): 生成される回答のランダム性を制御するパラメータ(高いと創造的、低いと決定的)。
