デジタル推進人材育成プログラム「マナビDX Quest」での学習が進みました。今回はAIプロジェクトの成功確率を高めるためのテーマ選定に関する考え方を学びました。
AIプロジェクトの成功率を高めるためのテーマ選定
テーマ選定の基本的な考え方を押さえた上で、優先的に着手すべきテーマの選び方を身に着ける。
・ビジネス課題のテーマを収集する
・テーマが機械学習で解決できるかを検討する
・成果とコストを見積りする
・テーマのスクリーニング
AIで取り組むべきプロジェクト
AI・機械学習で優先的に取り組むべきプロジェクトは、解決したいビジネステーマから機械学習での成功事例があり着手可能なもの、中でも高いROI(費用対効果)**が見込めるテーマである。
(成功事例 + 高いROI)
中でも機械学習に向いているのは、既存ビジネスの自動化と最適化 である。(作業の自動化、生産性向上、コストの削減、顧客満足度向上、など)
革新的な技術ということで新しいビジネスモデルや新商品の開発が期待される場合が多いが、まずは 短期間・低投資で成果を得やすい既存ビジネスの局所改善 に取り組むと良い。
既存ビジネスの改善は、具体的に売り上げの向上・作業時間の削減などを数値化し目標とする(KPI、重要指標達成度)。
候補となるテーマの見つけ方
①他業種の先行事例
②目的のカテゴリーが改善したい業務に当てはまるか
③業務プロセスの洗い出し
Signateではこれまでに先行事例として、車両カメラの物体検出、菓子食品の売上予測・ファッションアイテムの画像分類・走行中の新幹線への着雪量予測・観光地の宿泊来客者数の予測 などのAI開発コンペを行った。
テーマの目的となるカテゴリーとしては、定量効果を得るか・定性効果を得るか をまず考える。
定量的効果(コスト削減・効率化、売り上げ向上・ロス削減)
・購入率・申し込み率の高い顧客を予測、優先的にアプローチする
・明細部分から経費のみを自動的に仕分け・算出する
・正品や不良品の誤分類・食品などのロスを削減する
定性的効果(リスク管理、品質向上)
・クレームの感情分析、パーソナライズド相談
・受付待ち時間の最小化
・生産工程での不良品検知
・インフラの劣化度判定(ひび割れ・汚れを画像分析する)
・セキュリティーリスクの検知
・債務不履行者の検知と予測
業務プロセスの洗い出し
自動化したい業務プロセスのうち、労力・作業時間・経験則 、その他「繁忙期に人員が不足する」「車の台数はこれ以上増やせない」といった 現場のニーズや制約条件をヒアリング する。
例、運送業における理想の業務フロー
データ受信・商品確認・配車・積み込みまでの過程には人力では重労働となってしまうが、機械学習を用いれればより効率化・工数先減が可能なフローがあることが判明した。商品の自動種別判別・配車手配の自動化・配送ルートの最適化等、などの機械学習で効率化可能な機能を実装する。
AIにできること - テーマ案に応じた機能
課題とする既存ビジネス・テーマ案に応じて、それぞれの機能から適用できるものを検討する
・識別 - 画像認識、動画認識、音声認識、言語解析
・予測 - 数値予測、マッチング、意図予測、ニーズ予測
・実行 - 行動最適化、作業最適化、コンテンツ生成、デザイン
・電力需要予測→蓄積データの量と年月・時間帯による再現性が高いため、向いている
・手書き文字の読み取り→蓄積データが多ければ非線形・非構造的な問題にも機械学習で対処できる
AIに技術的に向いていないテーマ
AIに技術的に向いていないテーマとして、次のような特徴があげられる
・データの性質に変化・再現性がない
・発生メカニズムが単純・少数因子、仕組みが明確になっている(より単純なモデルでOK)
・過去のデータ・正解ラベルが割り振れるデータが殆どない
・KPIが定性的
・100%の精度が要求される。人間で100%正解できない問題はAIにも対応できない
・局所的改善によるインパクトが小さい
・地震予知→同じ場所・規模の地震はほぼ発生しない。再現性が低いため、AIテーマには向かない。
・入力業務の自動化→入力の自動化はRPAのようなルールベースのシステムで実現する場合が多い。機械学習には向いていない。
また、社会的・倫理的観点からハイリスクとなるテーマも存在する
ハイリスクAI
・自動走行AI(死傷事故の発生)
→人の生命にかかわる決定を機械に委ねてはならないというのがコモンセンスであるほか、開発者にAIの起こした犯罪・製品の欠陥に関して責任を持つ不法行為責任・製造物責任が帰する可能性がある。不法行為責任に関してはAIではなく所有者の故意・過失が問われ、また製造物責任は過失の有無に関わらず責任が帰される。
・従業員採用AI(AIによる差別・バイアスが発生する)
→バイアスを適切に取り除かないと差別や偏見の温床となり公正な採用妨げされる。
・コンテンツ生成AI(著作権問題)
→AIの教師データとなるコンテンツの著作物の許諾を巡る訴訟が発生している。AIを用いた悪質なパクリ・祖製品の乱造は改正著作権法30の4に書かれている「享受目的で機械学習を利用すること」がどこまで法的に許されるかの曖昧さも合わさり社会問題となっている。
・生体データを用いるAI(個人情報問題)
声優・俳優をスキャンし生体データを販売する等、あからさまに肖像権や表現の自由をめぐる問題も。特定人物の容姿や声紋は生体データであり、それらを模したデータ・製品の販売はアメリカ・EUでは規制されている。
・ヒト型・動物型ロボット(文化的・宗教的背景)
人間・生物を模倣した機械は文化的・宗教的背景が異なると問題視される。生物や人間を真似ることに関して、どのような文化的背景があるかも要調査となる。
・医療(診断と手術)の自動化→技術的には達成可能だが、患者の身体・生命にかかわる意思決定は現状の機械学習で行うべきではない。
・SNS・ウェブサイトの不適切コンテンツの検知
→技術的には達成可能だが、機械学習による検閲は誤検知の可能性がありハイリスクとなる。このような表現・言論・通信の自由に関わる意思決定は機械学習で行うべきではない。
AIプロジェクトにおける成果・コスト・ROI試算の方法
・KPI (Key perfornamce indicator)- 重要指標達成目標、もしくはその率
・ROI (Return on Investment)- 投資利益率
プロジェクトの目的が定量的な指標:売上向上・コスト削減・業務効率化などの場合、成果をKPI・ROIといった指標に換算可能 である。具体的には購買率、獲得案件数、人件費、在庫数、工数当たりの作業時間などを数値化して比較する。
目的が定性的な指標:データ資産の改善、人材の高度化、顧客満足度の向上、生産体制の改善・拡大など定性的な目標の場合、効果の測定が難しくなる。しかし 競争力の向上、企業ブランドの向上には定性的な効果のあるプロジェクトが欠かせない ので、実施する価値がないとは一概に言えない。定性的指標の改善には1年間ほどで効果が分かる定量的な指標と違い長期的な取り組みが必要となる。
コストの資産
・初期開発費 - 開発費、PoC費用、データ取得費、インフラ構築費
・運用費 - インフラ開発費、モニタリング費
機械学習プロジェクトでは開発前にどれだけ精度を確保できるかが分からない ので、従来のソフトウェア開発のフローにPoC段階で計画を変更する・検証後に再学習するなどのフローを考慮した分の費用と時間を必要とする。
「できれば誤分類はほぼ0%にしたい」という要望が上がることが多いが、実際には90~95%ほどの精度が限界 となる場合が多い。その場合は従来の属人的な工程などと組み合わせて別のサービスを提案する、等の工夫や折半が必要になる。
AIプロジェクトにおけるコストは初年度が初期開発費をふくめ最も高くなり、その後も運用費を要するケースが殆ど。*初年度分の開発費をその後の成果金額で何時回収できるか、また総運用費は目的とする費用対効果を何時上回ることができるか**を換算しなければならない。
(ROIが1以上になるのは何時か)
ROI = 成果金額 / 初期開発費 + 総運用費
ROIの試算
ROIはそれぞれ要求定義時、PoC完了後の2回のタイミングで試算する。要求定義時にはモデルがないため可能な精度が分からないが、PoC完了後はモデルの汎用制度と実用時の効果が明確となり正確なKPI・ROIが算出しやすくなる。