機械学習入門！偉い人から「AIで何かいい感じにやっといてよ！」って言われたら

Last updated at 2022-07-02Posted at 2022-06-28

ひょんなことから、これまで無縁だったAI/ML系のお仕事に巡り合うこととなったので、AIとか無縁だった普通のクラウドエンジニアが機械学習やっていき！で色々調べだした際のことはじめナレッジを残しておきます。

まずは有識者に相談してみた

幸いなことに社内にAI/ML技術に関するコミュニティが存在していたため、そちらの運営メンバー（@Synoharaさんほか）へ相談に駆け込むことに。

今回の案件経緯は超雑に言うと 「特定の人力業務をAIで何かいい感じにしたい（白目）」 風の要件だったのですが、そもそも機械学習を活用するにあたっての基本的なアプローチを教えてくれました。

まず最初は 「機械学習を使わずに済ませられないか」 から考えてみるのがよい。
適当なデータをどんどんAIに取り込んでも、役に立たないデータしか出てこない （ガベージイン・ガベージアウト）
AWSなどクラウドをはじめ、機械学習ソリューションは多数存在するが、どの製品を使うかよりまずは業務要件をヒアリングして深掘りし、人力でやったらどうなるかというプロセスを具体化してみるのがよい。
機械学習でとりうるアルゴリズムは多種あるため、今回の業務要件に類似した案件事例を探してみるのがよい。それを元にアプローチを絞り込む。具体的な製品選定はそれから。

AIド素人のワイにとってはまさに目から鱗！
そして上記のような基本的なアプローチを学ぶのにうってつけのバイブルがあるよということで、オライリー社の「仕事ではじめる機械学習」という書籍を勧めていただきました。

→ 早速オライリーeBookを購入しました。特に書籍の序盤で基本的なアプローチが十分学べるということで、そこから学んだエッセンスを本記事にアウトプットしていきます。

「未知のデータに対して過去の経験を元に機械が予測する」のが王道パターン。

課題を公式に落とし込む：
（重要。人間が正解できない課題はAIにも解けない！）

道具選びと前処理：
（重要。大量データは下処理しないと性能が出ない！）
4. システム設計を考える
5. 特徴量、教師データ、ログを設計する
6. 実データを集めて前処理する

モデルの作成：
7. 探索的データ分析を行い、アルゴリズムを選定する
8. 学習、パラメーターをチューニングする

実装：
9. システムに実装する
10. 予測精度や実業務の指標をモニタリングする

※「AIで何かいい感じにやっといてよ！」な上司に困らないためのポイント

機械学習は技術的負債となりやすいため、安易に使うのは禁物！
以下のような弱点をしっかり理解しておくこと。

確率的な処理があるため自動テストがしづらい。
テストでは見つけられなかった危険な出力が本番で発生してしまう可能性もある（例：Googleフォトが黒人の写真をゴリラと認識してしまった…等）
時間が経つとトレンドが変化し入力データの傾向が変わる。
トレンドの変化に対応するためには予測モデルのメンテナンスが必要になる。

また、以下の特徴によりメンテナンス負荷も高くなってしまう。

じゃあ逆に、どんな課題ならAIにうってつけなのか？

→ これらの条件が整っていれば、まずMVP（スモールスタートできる最小限のプロダクト）を作ってみる。まずはMVPを検証することで、大掛かりなシステム構築の手戻りリスクを緩和することが可能。

ここまで読んでみたら、機械学習に興味がでてきた方もいるのではないでしょうか？

ぜひお近くの本屋で手に取ってみたり、電子書籍がお好きな方はオライリーのeBookで買ってみることをオススメします。
EPUB＆PDF形式でダウンロードできますので、iPhoneやMacのBooksアプリで快適に読むことができ、私もKindleより気に入っています。