[前回] AWS公式資料で挑むMLS認定(1)-試験ガイドを読む
はじめに
Amazon AI/機械学習の関連サービスを理解する前に、
まずは、AI/機械学習の基本知識から。
人工知能(AI: Artificial Intelligence)とは
- AIとは
- 人間の知能に関連する認知的問題の解決に取り組む、コンピュータサイエンスの分野
- 学習
- 問題解決
- パターン認識
- 人間の知能に関連する認知的問題の解決に取り組む、コンピュータサイエンスの分野
- 機械学習の由来
- 研究者Pedro Domingos教授の機械学習の"5部族"
- 論理学と哲学に由来するシンボリスト
- 神経科学から派生したコネクショニスト
- 進化生物学に関連する進化論主義者
- 統計学と確率に取り組むベイジアン
- 心理学に由来するアナロジー主義者
- ※ 機械学習のさまざまなアルゴリズムの背景がわかったような。。。
- 研究者Pedro Domingos教授の機械学習の"5部族"
- 学習手法
- 教師あり
- トレーニングデータ(学習データ)に事前用意の正解を与えた状態で学習させる手法
- 教師なし
- トレーニングデータに正解を与えない状態で学習させる手法
- 教師あり
- データとAI
- データはAIの燃料で、データが増えるほど賢くなり、学習速度が増加
- データはどこから
- Amazon Redshiftなどデータウェアハウスから収集および抽出
- Mechanical Turkなどのグランドトゥルースにより
- グラウンドトゥルース(Ground truth)とは、推論ではなく、直接の観察と測定によって提供される、真実であることがわかっている情報
- Kinesis Streamsにより動的に取り出される
- IoTのセンサー技術により、さまざまなソース、場所、対象、イベントから入手
機械学習(ML: Machine Learning)とは
-
機械学習(ML)とは
- 人工知能の領域から派生したコンピュータサイエンスの分野
- 名前の由来は、パターン認識や学習に使用されるいくつかのベイジアン技術から
-
機械学習の中核となるアルゴリズム
- 記録されたデータに基づく
学習や予測
- 不確実性の下で効用関数の
最適化
- 効用関数(Utility Function)とは、物/エネルギー/情報/サービスなどの効用を数値におきかえた関数(数学モデルのこと?)
- データから隠れた構造を抽出し簡潔に表現する
データ分類
- 記録されたデータに基づく
-
通常のプログラミングとの違い
- 通常のプログラムコードは、所定入力に基づいて固有の出力を生成する
- 機械学習は、プログラミングでは明示的解決、適用が困難な場合に使用
-
機械学習モデル(MLモデル)
- データを使用し生成される統計的コード(関数)
- MLモデルの機能
- 所定の入力に基づいて結果を予測できる最適な関数を見つける
- 入力サンプル(教師ありは出力サンプルもあり)から認識されたパターンに基づき適切な結果を出力
- MLモデルの品質と量はトレーニングデータによって決まる
- MLモデルの評価
- 評価スコアを用いて、予測とパフォーマンスに関する統計的信頼性を確保
- MLモデルまたは個別予測の決定に、評価スコアが必要不可欠
-
ビジネスにおけるAmazon機械学習
- Amazon社自身が、機械学習ベースのシステムに基づきビジネス構築した結果
- ビジネスの成長
- 顧客サービスと顧客選択の向上
- 物流スピードと品質の最適化
- AWSの機械学習関連サービスについて
- 俊敏性と費用対効果を備えたITインフラストラクチャを利用できる
- Amazon.com規模のミッションクリティカルな環境でテストされてから、AWSサービスとして公開される
- 機械学習は従来のビジネスインテリジェンス(BI)を補完
- BIは、過去のビジネスデータの報告に重点を置く
- MLは、過去の傾向と取引に基づいて将来の結果を予測
- Amazon社自身が、機械学習ベースのシステムに基づきビジネス構築した結果
-
ビジネスへのML導入ステップ
- 課題特定
- ビジネスメリットがある適切な予測を選定
- データ収集
- 過去のビジネスメトリクス(取引、販売)に基づきデータ収集
- MLモデル構築
- 収集データに基づきMLモデル構築
- MLモデル実行
- モデルの予測出力をビジネスシステムに適用し意思決定
- 課題特定
※ 引用元: 企業への機械学習の導入
- 機械学習のユースケース
- 異常検出
- 予期されるパターンまたはデータセット内で、他の項目と合致しない
項目/イベント/観測値
を特定
- 予期されるパターンまたはデータセット内で、他の項目と合致しない
- 不正検出
- 不正または不適切な項目検出に役立つ予測モデルを構築
- カスタマーチャーン
- 顧客離れを検出し、プロモーションまたはカスタマーサービスなど前もって対処可能
- ※ カスタマーチャーンとは、一定期間離脱してしまったユーザーや、有料会員から無料会員にダウングレードしてしまったユーザー
- コンテンツのパーソナライズ
- 予測分析モデルを使用し、ユーザーの過去の行動パターンに基づき、商品/サービスの推奨やWebサイトフローの最適化
- 異常検出
おわりに
AI/機械学習の基本知識を勉強しました。
次回から関連サービスを一つずつマスターします、お楽しみに。