たまたま上記の記事を拝見し、「ついにAWSでも生成系AIのサービスが公開されたんだなー」と思い、いろいろ調べてみました。
記事の内容のイメージとしては「Bedrockで何ができるの?AWSの生成系AIサービスは何が違うの?」という部分に回答するような感じで書きます。
あくまで概要で、技術的なお話や精度については他の方にお譲りします。
基本的なAWSサービスの知識はある前提の話となりますのでご了承ください。
概要
AIの基盤モデルを呼んでいるFMと呼んでいる。
テキスト生成、チャットボット、検索、テキスト要約、画像生成。
APIを通じて利用できる。
データはサービス向上のために使用されることもなく第3社のモデルプロバイダーと共有されることもない。AWS PrivateLinkを使うことでインターネットも避けることができる。
当然IAMでの管理も可能
当然CloudWatchやCloudTrailでの監視も可能
S3のURIを指定することで大量のデータに注釈をつけることもなく、FMの微調整が可能
KMSでの暗号/複合も可能
料金は使用するモデルによる
やはり他のAWSサービスとの統合がスムーズに行えるところがポイントだと感じました。
すでにAWS環境を構築している企業からしたら学習のコストも低く、またPrivateLinkなどのセキュアな環境での使用も明言されているため一気に生成系AIの導入が進むのではないかと感じました。
APIでの利用も可能なので開発側としても扱いやすいのではないかと感じました。
ちなみにAWS公式自身はAWS内で生成系AIを利用するメリットは下記のように述べています。
・様々なモデルから選択可能
・データの暗号化およびをVPC外へのデータの露出を防ぐ
・費用対効果が高い
・SageMakerやS3など使い慣れたサービスでFMを構築可能
・他のAIサービス(Amazon CodeWhispererなど)との組み合わせが可能
利用に際して
モデル毎に事前申請が必要。
リージョンはバージニア、オハイオ、オレゴン、シンガポール(Anthropicだけ)
利用可能なモデル
A21 Labs/Jurassic-2 Ultra v1
日本語不可、質問に対する応答、要約が得意
最大トークン8191
特徴は下記のようです。
すべてのJurassic-2(以下、J2)モデルは膨大なテキストコーパスで学習されており、人間のようなテキストを作成したり、質問応答やテキスト分類などの複雑なタスクを解決可能な汎用性の高いテキストジェネレータとなっています。
J2モデルは、タスクの説明やいくつかの例を含む適切なプロンプトを作成することで、事実上あらゆる言語タスクに適用することができます。一般的にプロンプトエンジニアリングと呼ばれるプロセスで、マーケティングコピーの生成、チャットボットのパワーアップ、クリエイティブな文章の生成の支援などによく使われます。
試行錯誤の結果、ユースケースに適したプロンプトを作成することができます。しかし、より良い品質を達成し、アプリをスケールアップするには、カスタムモデルをトレーニングすることをお勧めします。
日本語が対応しておらず、特徴が不明瞭なのでJ2を使用していないのであれば候補外な印象。
→Bedrock内のモデルの説明だと日本語は対応してないように見れるが一応日本語で回答もしてくれる。ただし精度がイマイチなよう。
Amazon Titan
AWSオリジナルの要約、テキスト生成、分類。オープンエンドのQ&A、情報抽出などのタスクオンためのLLMモデル
現状は文章を埋め込み表現に変換するTitan Embeddingsが利用可能で文章生成は未実装
provisioned throughputあり
最大トークン8000
Anthropic/Claude v2
質問への応答、要約、ワークフローの自動化、コーディングなど
日本語にも対応
provisioned throughputがありinput, outputの合計が月間1441kトークン以上ならprovisioned throughputの方がオトク
AWSとしても記事を出しているので現状はこのモデル推し?
7月のClaude v2へのアップデート内容は下記
・インプットが100,000トークンまで可能に。
・GREというテストのリーディングとライティングで大学生を含めた上位10%にランクイン
・PythonのCodex HumanEvalというコードテストのスコアが56%→71.2%に
・非暴力的な表現がClaude v1.3の2倍に
Cohere/Command 14.6v
ビジネスアプリケーション向けのテキスト生成モデルと、100 以上の言語での検索、クラスターリング、分類用の埋め込みモデル。
最大トークン4096
CohereのCoralというwebサイトをもとに質問に対して回答するサービスでは日本での質問はできるが回答は英語となった。
AWS上のCommandについては要確認。(現状リクエスが承認されないため承認され次第実施)
→こちらもJ2同様日本語の調子は良くなさそう。
Stability AI/Stable Diffusion XL
テキスト → 画像に変換する生成系AI
AWS上で画像生成する場合は現状これ1択
最大トークンは8192
料金
provisioned throughputはAmazon TitanとClaude v2のみ
基本的(Stable Diffusion以外)にインプットアプトプットそれぞれ1000トークンあたりの料金となる。
感想
今までクラウド上で生成系AIを動かそうと思ったらChatGPTに対応していたAzureが第一候補だったがついにAWSにも実装されたので当初の想定通り生成AIの導入が進みそう。
AWSがデータがAWSの外に出ることはないですよ、とアピールしているので企業としてもどんどん自社のデータを活用してAIのトレーニングも進めそう。
本日10/1(日)の朝にモデルの承認のリクエストをしたが夕方になってもまだ承認されないため事前に承認しておく方がよさそう。
→10/6(金)に承認されました。
以上ざっくりメモでした。
最後までご覧いただきありがとうございました。
参考文献
・AWSでの生成系AI
https://aws.amazon.com/jp/generative-ai/
・Amazon Bedrock
https://aws.amazon.com/jp/bedrock/
https://aws.amazon.com/jp/bedrock/pricing/
・youtube(AWS)
https://www.youtube.com/watch?v=ab1mbj0acDo
・A21 Labs/Jurassic-2 v1
https://docs.ai21.com/
https://docs.ai21.com/docs/jurassic-2-models
・Anthropic/Claude v2
https://docs.anthropic.com/claude/docs
https://www.anthropic.com/index/claude-2
・Cohere/Command 14.6v
https://cohere.com/
https://docs.cohere.com/docs
・Stability AI/Stable Diffusion XL
https://platform.stability.ai/docs/getting-started