この記事について
日本ディープラーニング協会(JDLA)の初学者向けAI講座を個人的にまとめたメモです。
受講は無料のため、このまとめ記事で興味を持ったらぜひ本家の講座を受講してみてください。
・AI For Everyone (すべての人のためのAIリテラシー講座) | Coursera
AI導入時の注意点/避けるべき落とし穴
AI導入時の落とし穴を避けることができれば、他の多くの企業よりも先を進める
AIがすべてを解決すると期待する
テクノロジー、データエンジニアリングリソースには限界があるため、AIができること、できないことについて現実的に検討する必要がある
だからこそ、ビジネス面の評価に加えて技術面の評価が重要
数人のエンジニアに頼る
機械学習エンジニアだけに頼ることはやめる
エンジニアとビジネス人材を相互に機能するよう組み合わせて協働することで、価値があり実行可能なプロジェクトを生み出す
AIプロジェクトが最初から機能すると期待する
AIは反復プロセスである
複数の試行にわたる反復を通じてのAI開発を計画する
従来の企画工程を変更なしで適用できると期待する
AIプロジェクトは他の企画工程と少し異なる
AIチームと協力して、状況に合ったタイムラインの見積もり、マイルストーン、KPIや指標を設定する
最高のエンジニアが必要だと思い込む
何かを試す前から、最高のエンジニアが必要だと思い込まない
代わりに手元のチームの構築を向上させる
重要なことは始めること、2回目3回目と重ねることでプロジェクトはよりうまくいくようになる
AI導入の最初の一歩
いくつかの最初のステップ
以下のリストは難易度が異なるため、出来るところから始めて徐々に取り組みを拡大させればOK
・友人と一緒にAIについて学ぶ
例:このコースを一緒に受ける、読書グループ(勉強会)を作る
・プロジェクトのブレインストーミングを開始する
「小さすぎるプロジェクト」はない
大きくやろうとして失敗するよりも、小さく始めて成功させる方が良い
・機械学習やデータサイエンスを担当する人を数人雇う
自社での学習やプロジェクト推進を支援してもらう
・AI担当役員やAI最高責任者などのAIリーダーを雇う/任命する
どちらかというと前述の機械学習エンジニアやデータサイエンティストを雇う方が優先
・企業のAI化の実行可能性についてCEO/取締役と話し合う
重要な質問「AIに優れた会社になれば、企業価値や効果が上がるかどうか?」
各種AI応用分野について(オプション1)
コンピュータービジョン
ディープラーニングの主な成功の一つはコンピュータービジョン
画像分類/物体認識
写真を入力として取り込み、その写真が何かを教える
例:顔認識
ユーザーが顔写真を登録 → 新しい写真を追加 → AIシステムが同じ人物か確認する
物体検出
物体が表示されるかどうかを検出しようとする
「認識」:ある/なし、またはYes/No (例:猫か、猫以外か)
「検出」:認識+位置を教えてくれる (例:車と歩行者が画像の中のどこにいるか?いないか?)
つまり、"画像にラベルを付ける"分類方法ではなく、"どこに物体があり、それが何か"を教えてくれる
画像セグメンテーション
物体検出からさらに一歩進んだもの
「検出」:物体の位置を長方形で囲んで表示する
「セグメンテーション」:物体ごとの境界を判別して別々に塗りつぶす
物体追跡
物体検出を動画に適用し、人物や自動車が移動すると枠が追跡する
自然言語処理(NLP)
自然言語とは、人間が日常生活で使う言葉
・テキスト分類
Eメールの内容からスパムメールを判別、製品説明の文章から製品のカテゴリを選定
感情認識:飲食店の口コミから肯定的な内容かどうかを判別する、等
・情報検索
Web検索など
・固有表現抽出
固有名詞(人物、地名など)を文章中から抜き出す
・機械翻訳
・その他:構文解析、品詞タグ付け
文章の単語から、どれが名詞でどれが前置詞か?等を検出する
単語と単語をグループ化することで文章全体の内容理解を助ける
例: The cat on the mat
音声
・音声認識(speech-to-text)
・トリガーワード/ウェイクワード検出
・スピーカーID
顔認識の音声認識バージョン、話者が誰かを特定する
・音声合成(text-to-speech, TTS)
テキストデータの読み上げ
ロボット工学
・認知:(ロボット工学では)「周囲の世界の状況を自分の感覚で把握する」ことを意味する
自動運転車:3Dレーザースキャン、LIDARスキャン
・経路計画:ロボットがたどるべき経路を見つけること
経路と速度などの計算
・制御:希望する経路をスムーズにたどるよう、モーターにコマンドを送る
自動運転車:ハンドル/アクセル/ブレーキの操作
一般的な機械学習
・非構造化データ(画像、音声、テキスト)
人間にとって理解しやすいためメディアなどではこちらが取り上げられやすい
・構造化されたデータ(リスト形式のデータセット等)
その他主なAI技術の紹介(オプション2)
教師なし学習
代表例が「クラスタリング」
クラスタリングアルゴリズムはデータを自動的に2つ以上のクラスタにグループ化する
一般的に市場のセグメンテーションに使用される
例:ポテトチップスの売上分析
単価と購入数量のデータを入れると2つのグループに固まった
安価・大量 ⇔ 高価・少量
店舗の立地などにより、大学生とビジネスマンといったグループの傾向分析に役立つ
教師あり学習との違い
教師あり学習:A→Bへのマッピングのため、出力BをAIシステムに伝える必要がある
教師なし学習:出力Bを伝えない代わりに、データを大量に与えて意味のある何かを見つけさせる
転移学習
既存のAIシステムを転用して別のAIシステムに役立たせる
非常に大きなデータセットですでに学習している場合に非常に効果的
例:自動車とゴルフカートの検出
自動車は10万枚の画像データがあるが、ゴルフカートは100枚しかデータが無い場合でも、
自動車検出アルゴリズムを転用して学習させることでゴルフカートを高精度で検出できる
車両や車輪の見え方、車両の動き方など自動車検出アルゴリズムで学んだ知識が活用できるため
強化学習
犬のしつけに似ている、良いことをしたら褒める・悪いことをしたら叱る
実際のシステムとしては、報酬を数値化して与え、最大化させる行動をとるように学習させる
- 報酬信号(正/負)を使用
- AIが上手に動いた時は正の報酬を与え、下手だった時は負の報酬を与える
- 報酬を最大化させることを自動的にAIが学習する
自律型ヘリコプターやアルファ碁など
GANs(敵対的生成ネットワーク)
新しい画像をゼロから合成するのに優れている
CG、ゲーム、メディアなどのエンターテインメント業界に応用する試みが行われている
ナレッジグラフ(知識グラフ)
非常に重要で広く活用されており経済的価値も大きい
実際の経済的影響と比較すると、学問的にはあまり研究されておらず過小評価気味
例:Google検索結果の右側に表示される情報
人名を検索すると、その人物に関連する情報が表示される
この情報は知識グラフから取得される
知識グラフとは、基本となる重要な情報をリストしたデータベース(誕生日、死亡日、プロフィール等)
現在、さまざまな企業がさまざまな種類の知識グラフを作成している(有名人、映画、ホテル、空港、観光地など)