はじめに
こんにちは、Webエンジニアの岩田史門(@SI_Monxy)です!
今回はAWS SageMaker JumpStartについて記事を書いてみました!
改善点や修正点があれば、コメントにて優しくご指導いただけると嬉しいです!!
概要
先日AWS Summitに現地参加してみて、生成AIやAWSの生成AI系サービスに興味を持ったので実際に触って見ることにしました。今回は数クリックでファインチューニングができるというSageMaker JumpStartを触ってみました。
生成AI活用で感じる課題
実際に生成AIをプロダクトに組み込んでいくとなると下記のような心配が上がると思います
- 新しいモデルが次々と出てきてキャッチアップが大変
- AIに関する知見がなくて、ファインチューニングって難しそう
- データが外に流出してしまうのではないかとセキュリティやプライバシー面で心配
SageMaker JumpStart
SageMaker JumpStartを利用すれば、前項であげたような課題の大半を解決できるように感じました
課題と解決
新しいモデルについていく大変さ、ファインチューニングって難しそう
- SageMaker JumpStartコンソールから利用でき、ぽちぽちと設定するだけ
- データをAWS内部に閉じて保管することができるので、外にでてしまう心配が減る
- 脆弱性診断のセキュリティスキャンを受けている
- 最新のモデル36種類ほどに対応しているし、数クリックでデプロイできる
- 日本語モデルもある
セキュリティとプライバシー
- HIPAA(ひっぱ)に準拠している
- 金融やEUのような堅めなところでも使われている
使い方
SageMaker Studio
- 使ってみたいモデルを選択する
- クリックするとモデルの詳細ページが開きます
モデルの詳細ページ
- 下記のような内容がかいてあります
- モデルのサイズと説明
- ライセンス
- ユースケースと使用方法
自分のデータでモデルをカスタマイズ
- 自分たちのデータを使ってカスタマイズができます
SDKを利用して自動化
- MLOpsパイプライン
ファインチューニング
- モデルを学習させるための用意したデータセットのパスを指定するだけ
- S3に保存したら、S3パスを設定するだけ
- モデルの学習をクリックする
- コストやスループット、レイテンシの設定もできるようです
ワンクリックでSageMakerにデプロイ
- 学習が終わったらモデルのデプロイをクリック
- オートスケーリングの設定などもできます
- ネットワークや暗号化などの設定もできます