はじめに
AWS Summit 2023に参加してきました。
(下記、AWS DeepRacerの最終戦の時の様子。最終戦で上位2グループがまさかの世界記録更新&同点で、この後2回目の最終戦が繰り広げられました。盛り上がりがすごかったです)
自分の振り返りと一緒に、何回かにわけ、受けたセッションの内容を紹介したいなと思います。
事例セッション②- 株式会社FLUX
- 題名: AWSで実現するデジタルマーケティングの未来
- 概要: 急成長スタートアップであるFLUXが抱える課題とその解決策を紹介されていた
株式会社FLUX 事業内容
- 「テクノロジーを簡単に、経済価値を最大化する」をミッションに、パブリッシャーと広告主向けにオンライン売上を最大化する様々なSaaSサービスを提供。
-
FLUX AutoStream: ユーザのサイト内にタグを設置、データ取得をし、AIによるユーザの自動セグメンテーションを行うことにより、オンライン売上を最大化するサービス
- タグ: 広告を経由してWebサイトにきたユーザーを判別、そのユーザがコンバージョンタグの設置されたサイトに到達すると、広告の効果による成果としてコンバージョンタグが記録・管理する
-
FLUX Targeting: AIでInstagram広告やGoogle広告などの運用型広告において、タグを設置、データを取得、AIによるオーディエンス(広告の受け手)を自動最適化するサービス
- 新規・リターゲティング対象の中から、よりCV(コンバージョン)寄与しやすいオーディエンスを絞り込み、最適化する
-
FLUX AutoStream: ユーザのサイト内にタグを設置、データ取得をし、AIによるユーザの自動セグメンテーションを行うことにより、オンライン売上を最大化するサービス
ワークフロー
- ユーザのサイトに埋め込んだタグが取得するアクセスログ等のデータをDBに保存
- DBを分析しモデルを作成し、それを使い独自のAPIを作成
- オーディエンスの購買スコアをつけ、それをユーザのサイトに共有することで、オーディエンス最適化を行う
- 上記フローを回すことで、広告のパフォーマンスを上げている
課題
- スループット(単位時間あたりの生産性)と継続性が不十分で、満足できるサービスを提供できていない
- MLパイプラインが構築できていない
- 毎日30TBほどの大量データを扱っており、ローカルで気軽に作業できないのにも関わらず、検証環境がない
- モデル管理の仕組みが不十分で、再現性が担保できない
- 専門家集団で個人の技術セットは高いが、環境が整っていないため、それが生しきれていない
- 要件定義が固まっていない
- ビジネスサイドの要件により、プロダクトの要件もころころと変わっていくため、開発が思うように進まない
- 人材不足
- データサイエンティストは十分確保できているが、インフラエンジニアが不在
- ワークフローをまわす人材はいるのに、ワークフローの環境構築ができない状況
- 予算的にインフラエンジニアを増やすわけにもいかない...
- MLパイプラインが構築できていない
解決策
- AWS技術サポートとタッグを組み、ハンズオンを開催したりなどしながら、検証環境を構築した
- 旧アーキテクチャ(Jupyterhub)から新アーキテクチャ(Sagemaker)への移行準備では、Amazon SageMaker Studio Labを活用し、Jupyterhubでの作業内容をいい具合にマージすることができた
- Amazon SageMaker Studio Lab: セットアップ不要の無料のSagemaker開発環境。MLを学び、実験することができる
- 旧→ 新アーキテクチャへの移行期間は10日程度
- 新アーキテクチャになってから、3営業日掛かっていたワークフローが0.5営業日に、大幅な業務効率化を実現した
- 検証環境をつくったことで、一週間で数回学習モデルの更新が可能になった
- モデル保存の部分でSageMaker Model Registryを採用し、モデルカタログを作成・管理できるようになった
- 学習部分(Sagemaker Training Job)では、スポットインスタンスを活用することでコスト効率化ができた
感想
- 課題の部分、特に要件定義が定まらずスループットが不十分という点は、(大なり小なりどの企業でも抱えてはいるだろうが)スタートアップならではだなと思ったし、特有の大変さを感じた
- MLパイプラインの部分は、完全に今所属している組織で抱えている課題と全く一緒で、本当にどの企業も通る道なのだなと思った(↓過去にブログにまとめているので、よかったら読んでみてください)
- インフラエンジニア不在の中、AWSからのサポートのみでここまでやり遂げたスピード感やバイタリティはかなりすごいなと思ったし、個人的にちょっとスタートアップで働くの面白そうだなと感じた
- ちなみに、今の会社ではPOCは完了したが実際の商用環境への移行が中々できないでいる。うちはデータサイエンティスト側の稼働に空きがなく、そこまで手が回っていない。重ねて、大きな移行になるので、どうしても慎重になる(失敗した時の損害がでかい)。だからと言って先延ばしにせず、確実に改善を進めるべきだなと思いました。反省。