はじめに
Azure AI Engineer Associate(AI-102)取得に向けた勉強でまとめた内容を本記事では投稿しています。
試験範囲の内容を私が勉強していく中で、
・忘れてしまっていた内容
・他の知識と絡めて理解した方が良い内容
・Microsoft Learnの読解に苦戦した内容
などをできるだけ分かりやすく簡潔にまとめることを意識しています。
Azureの勉強を一から始め、AI-102取得を目指している方の参考になれば幸いです。
※本記事の内容が必ず試験に出るわけではないこと、ご注意ください
※勉強しながら投稿しているため、追加で学んだことがあれば随時投稿内容を更新します。
試験対策のまとめ
LUISにおけるエンティティの種類
- エンティティは、ユーザーの意図に関連する項目/要素
⇒発話から抽出できるデータを定義するもの発話 予測される意図 抽出されたエンティティ 説明 I want to order a small pizza orderPizza small Size
エンティティはsmall
として抽出Buy 3 tickets to New York buyTickets 3, New York ・ ticketsCount
エンティティは3
として抽出Destination
エンティティはNew York
として抽出 - エンティティを作成するには、名前と種類を指定する必要がある
リストエンティティ
- 固定かつ限定された関連単語セットとそのシノニムを表す
- 複数のシノニムやバリエーションを認識し、それらの正規化された出力を抽出可能
- 照合は大文字と小文字が区別され、完全に一致している必要がある
正規化された値 シノニム Small sm
,sml
,tiny
,smallest
Medium md
,mdm
,regular
,average
,middle
正規表現エンティティ
- 指定された正規表現パターンに基づいてエンティティを抽出
- 構造化テキスト、または特定の形式で想定される英数字値の定義済みシーケンスに最適
エンティティ 正規表現 例 Flight Number(便名) flight [A-Z]{2} [0-9]{4}
flight AS 1234
クレジットカード番号 [0-9]{16}
5478789865437632
事前構築済みのエンティティ
- 日付、時刻、数字、測定値、通貨など、一般的な情報の種類を認識するためのセットが含まれている
- 動作は事前にトレーニングされており、変更はできない
エンティティ 値の例 PersonName James, Bill, Tom DatetimeV2 2019-05-02
,May 2nd
,8am on May 2nd 2019
Pattern.Anyエンティティ
- エンティティの開始位置と終了位置を示すためにパターンのテンプレート発話でのみ使用される可変長プレースホルダー
- 特定のルールやパターンに従っており、構文構造が固定された文への使用が最適
発話の例 パターン エンティティ Can I have a burger please? Can I have a {meal} [please] [?]
burger Can I have a pizza? Can I have a {meal} [please] [?]
pizza
機械学習(ML)エンティティ
-
コンテキストを使用し、ラベル付けされた例に基づいてエンティティを抽出
-
機械学習アルゴリズムに依存しており、アプリケーションに合わせて正しく調整するにはラベル付けが必要
-
常に正しい形式とは限らないものの同じ意味を持つデータの識別に最適
発話 抽出されるproduct(商品)エンティティ I want to buy a book book
Can I get these shoes please? shoes
-
1つのMLエンティティは、それぞれが独自のプロパティを持つ、より小さいサブエンティティで構成可能
- Addressエンティティの例
- Address:4567 Main Street, NY, 98052, USA
- Building Number:4567
- Street Name:Main Street
- State:NY
- Zip Code:98052
- Country:USA
- Address:4567 Main Street, NY, 98052, USA
- Addressエンティティの例
-
参考
次の試験対策のまとめ
- AI-102試験対策のまとめ「QnA Makerクライアントライブラリを使用したナレッジベースの作成」
学習内容をまとめたページの一覧