この記事について
日本ディープラーニング協会(JDLA)の初学者向けAI講座を個人的にまとめたメモです。
受講は無料のため、このまとめ記事で興味を持ったらぜひ本家の講座を受講してみてください。
・AI For Everyone (すべての人のためのAIリテラシー講座) | Coursera
ケーススタディ:スマートスピーカー
「Hey デバイス、ジョークを言って。」
コマンドを処理するための必要なステップ:
1. トリガーワード/ウェイクワードの検出
オーディオクリップ → 「Hey デバイス」(0/1)
ここではトリガーワードを聞かせるだけ
2. 音声認識
オーディオクリップ → 「ジョークを言って。(tell me a joke)」
1と違うのは"オーディオクリップからテキストへのマッピング"だということ
オーディオクリップから4つの単語(tell me a joke)にマッピングする
3.意図認識
4つの単語によって要求されていることが何なのかを把握するための工程
現在のスマートスピーカーではシンプルなタスクのみ実行できる
例:ジョーク、時間、音楽、電話、天気
音声認識の出力である4つの単語を入力として、別の出力(上の例の5つ等)にマッピングするAIを使う
ここでの出力は実際には「スマートスピーカーに出来ること」なので数百や数千パターンになる
ジョークを言わせる時の言い方にも沢山のパターンがあるが、それを適切に認識できるようにするのがこの意図認識システムの役目
4. ジョークの実行
あらかじめ用意されたジョークの中からランダムで再生
アルゴリズムは以下の4つのステップ
トリガーワード検出 → 音声認識 → 意図認識 → 実行
AIシステムでは、このような複数のステップを経るためのプロセスを『AIパイプライン』と呼ぶ
このようなシステムでは沢山のAIチームがAIパイプラインの各コンポーネントごとに組織される
「Hey デバイス、タイマーを10分に設定して。」
コマンドを処理するための必要なステップ:
1. トリガーワード/ウェイクワードの検出
オーディオクリップ → 「Hey デバイス」(0/1)
2. 音声認識
オーディオクリップ → 「タイマーを10分に設定して。」
3. 意図認識
「タイマーを10分に設定して。」 → タイマー
ジョークの例と違う点は、タイマーの設定時間を認識する必要があること
そのため次の実行ステップが2つに分かれる
4.
a)継続時間の抽出
テキストから、時間を示す「10分」というフレーズを抜き出す
3と4aの両方のコンポーネントが十分強固なら、色々な言い方でもちゃんとタイマーが10分で動作する
b)継続時間でタイマーを開始
コマンドを実行するにはソフトウェアコンポーネントが必要
スマートスピーカーに搭載し適切に実行する
まとめると重要なステップは以下の4つ
- トリガーワード/ウェイクワードの検出
- 音声認識
- 意図認識
- コマンドを実行するための特殊なプログラム
ケーススタディ:自動運転車
運転方法を決定する重要なステップ
1. センサーによる車検出/歩行者検出
前後左右の写真、レーダー、Lidar(光検出と測距)
2.経路計画
車の経路を決める
3. 自動車のコントロール
経路計画に沿って走行するように車体をコントロールする
ハンドル/アクセル/ブレーキ
より複雑な自動運転車のステップ
1. センサーによる車検出/歩行者検出
・画像/レーダー/Lidar + GPS/地図
・車の検出 → 軌道予測
・歩行者の検出 → 軌道予測
→検出後にどこに向かうか予測することで、動くものに対応する
・車線の検出
・信号機の検出
・障害物の検出
→車や歩行者以外の障害物(動物など)
2. 経路計画
3. 自動車のコントロール
AIチームの典型的な役割分担
AIに関する役職や職責はまだ定義が曖昧な部分も多い
大規模なAIチームがどんなものか、代表的な役割を紹介する
役割の例
・ソフトウェアエンジニア
AIチームの大半を占める、半数または過半数以上
・機械学習エンジニア
機械学習アルゴリズムを構築するソフトウェアを作成する
A→Bマッピングを司るソフトウェアや、製品に必要な他の機械学習アルゴリズムを構築するソフトウェア
つまり実際に行われる職務はこの講座で解説されてきたような内容
- 車の写真と位置のデータを収集
- ニューラルネットワークを訓練
- アルゴリズムの出力が正確であるか反復させる
・機械学習研究者
典型的な役割は機械学習の最新技術を拡張すること
論文を発表する人もいるが、研究は行っても出版をあまりしない人もいる
・応用機械学習サイエンティスト
機械学習エンジニアと機械学習研究者の間のどこかに存在する
実際の職務は、学術文献等を調べて最先端の技術を見つけること、直面している問題に適応させること
例:どのようにして最先端のトリガーワード検知アルゴリズムをスマートスピーカーに適応させるか?
・データサイエンティスト
データサイエンティストの役割はあまり明確に定義されておらず、その意味は変わり続けている
主な職務の1つはデータを調査して洞察を提供し、チームや幹部にプレゼンを行うこと
→ビジネスの意思決定を促進するため
他のタスクを担当するデータサイエンティストもいる
今日のデータサイエンティストは仕事内容が機械学習エンジニアに似ている場合がある
・データエンジニア
ビッグデータの進化に伴い増加中、メインの役割はデータの整理を手伝うこと
→データが保存され簡単にアクセスでき、安全かつ費用対効果の高い方法で整理される
※データを保存することがなぜ大事なのか?
一部の企業では、データ量が非常に大きくなっている
データサイズの例:楽曲(mp3)…数MB、映画(ストリーミング)…1GB以上
自動運転車は1分間の操作ごとに数ギガバイトの情報を収集する場合がある、映画数本に相当
→数日~数年分のデータを保存するには本格的なデータエンジニアリングが必要
大規模なインターネット企業の場合、1日に数PB(ペタバイト)の情報を保存するようなチームもある
(1,000GB = 1TB、1,000TB = 1PB)
・AIプロダクトマネージャー
何を構築するかを決定する仕事
AIが出来る事を考慮し、「実現可能で価値のあるもの」を見出すための新しいスキルセットが要求される
小さなチームから始める
エンジニアが一人しかいない、自分自身しかいないとしても、小さなチームで始めることが可能
AIトランスフォーメーション・プレイブック(パート1)
5つのステップ
- パイロットプロジェクト実施
- インハウスチーム組成
- トレーニング実施
- AI戦略策定
- 社内外へのコミュニケーション
1.パイロットプロジェクト実施
・最初のプロジェクトでは、「最高の価値を求めることよりも成功すること」が最重要
成功する可能性が高いものを選択する
・6~12ヶ月以内に牽引力を示す
講師の事例:
Googleでは当初DLについて懐疑的な意見もあったが、まずは音声認識で成果を出した。
それを見ていた他のチームがAIに興味を示し始め、マップ、広告と広がっていった。
・社内か外部委託
社内にAIチームがまだない場合、可能であれば最初のいくつかのプロジェクトは外部委託を推奨
委託を経ることで社内により多くの専門知識が得られ、それ以降のプロジェクトに活用できる
2.インハウスチーム組成
一般的な企業では事業部が並列で存在する
AIチームはその事業部内ではなく、事業部として並列に組織すると良い
事業部のリーダーはAIの専門家ではないため、適切にAIチームを管理して構築することは難しい
AI専門のユニットを社内に作り、各事業部のプロフェッショナルと活用方法を模索した方が良い
また、社内全体にまたがるツールやインフラの改善にもAI事業部は貢献できる
3.トレーニング実施
社内全体の多様なレベルの人々に対し、幅広くAIトレーニングをすることが重要
AIが自分たちの業務や役割にどう作用するのかを理解する
役職/レベルごとに学ぶべきことには差がある
参考に最低限の学習時間を例示
- 経営幹部、上級リーダー:4時間
- 部門リーダー:12時間
- 社内エンジニア:100時間
AIトランスフォーメーション・プレイブック(パート2)
4.AI戦略策定
・AIを活用して、業界に特有の優位性を生み出す
このプレイブックの特徴は、「AI戦略の策定」がステップ1ではなく ステップ4であること
多くのCEOは「戦略」はステップ1にして欲しいと言う
しかし、そういった企業はAIを試す前に実現性のある AIプロジェクトが何か理解する
その結果、非常に「アカデミック」な戦略に陥りやすい
まず最初はパイロットプロジェクトを開始することを勧める
少しずつチーム作りを始めてトレーニングを提供し始める
すると次第にAIを理解し、どのようにビジネスに適用できるか、どう戦略を策定すればよいかわかってくる
・AIの好循環に合わせた戦略の設計を検討する
AIの好循環に合わせた戦略の設計
例:ウェブ検索
新規参入者が既存の大規模なウェブ検索エンジンと競争することは非常に難しい
・他社よりほんの少しでも良い製品(検索エンジン)を持っていると、より多くのユーザーを獲得できる
↓
・ユーザーが多いとより多くのデータを収集できる
↓
・そのデータをAIエンジンに入力して、さらに優れた製品(検索エンジン)を生み出せる
↓
・さらに多くのユーザーを獲得できる
︙
新規参入者がこの「AIの好循環」と呼ばれる自己強化のフィードバックループに食い込むことは困難
しかし、既存の覇者が存在しない新しいアプリケーション分野/新しい市場に参入する場合、この好循環を活用する一人となるように戦略を発展させられる
・データ戦略の作成を検討する
戦略的なデータ収集
例:Googleは多数の無料サービスを提供することでユーザーからデータを収集している
統合データウェアハウスの構築
例:50の異なるデータウェアハウスが個別の管理下にある場合、全容を明らかにするためにAIエンジニアまたはAIソフトウェアがデータをすべて集めることは困難
・ネットワーク効果とプラットフォームの利点を作り出す
勝者がすべてを獲得するダイナミクスの業界では、AIは企業を成長させる巨大因子になり得る
→魅力的なプラットフォームを生み出すことでユーザーを集める
5.社内外へのコミュニケーション
関連する利害関係者と適切にコミュニケーションを取ることが重要
- 投資家関係
- 政府関係 (例:医療分野、自動運転車)
- 消費者/ユーザーの教育 (製品の変更による影響を受ける)
- 才能/人材採用
- 内部コミュニケーション (会社を変えていく際には、社内から不安を抱く人が出てくる)