はじめに
こんにちは。Tsukasaです!
最近どこに行っても「生成AI」って言葉を聞かない日がないですよね。
この間参加したJapan IT Weekでも生成AIの話が多かったですし、来月参加するAWS Summitでも生成AIに関するワークショップやイベントが沢山あるみたいです。
というわけで今回はAWSの生成AIの代表格であるAmazon Bedrockを用いてハンズオン学習をやってみました!
そもそもBedrockとは?
「Amazon Bedrock」は、サーバーレスで手軽に最新の生成AIモデルを利用できるAWSのサービスです。生成人工知能(生成AI)は、会話や画像などの新しいコンテンツやアイデアを作成できるAIの一種です。従来のAIとは異なり、生成AIが自ら獲得した学習成果から新たなコンテンツを生成することができます。利用に専門的なスキルは不要で、誰でも簡単にコンテンツを生成できるため、業務効率化やアイデア創出などビジネスシーンでも活用が進んでいます。
AWSの公式にも詳細が載っていますので、気になる方はこちらも是非ご確認ください。
今回の実装内容
とはいえ、AWSもBedrockも初心者の自分が何の材料もなしにBedrockを触ることは不可能です。
そのため今回はBedrockといったらこの方!みのるんさんが初心者の方でも実装できるBedrockのハンズオン学習手順を作成してくださいました。
内容としては、BedrockのナレッジベースでRAGアプリを作成し、社内文書を検索することができるようにすることがゴールになります。
具体的な手順は是非こちらの記事を見ていただき、実践していただけたらと思います。
私も実際にやってみたので、その内容について書いていけたらと思います。
やること
今回の実装のイメージは下記のようになります。
IAMユーザーの作成
S3バケットの作成
Bedrock側の実装
アプリ側の実装(CloudShell)
それでは1つずつ見ていきたいと思います。
IAMユーザーの作成
まずはIAMユーザーの作成からです。
AWSのアカウントを既にお持ちの方でしたら、ルートユーザーというログインユーザーがあるかと思いますが、ルートユーザーだと権限が強すぎるので、このような作業には専用の個別ユーザーを作成するのがベストプラクティスだそうです。(初心者なので、この辺りもまだよくわかっていないんです。。)
そのためIAMユーザーを作る必要があります。
コンソール画面からIAMと検索をして、IAMを開きます。
その後ユーザーから「ユーザーの作成」をクリックし、ユーザーの作成を行います。
こちらでは詳細は割愛いたしますが、
その後はステップ1~4までを手順通りに行います。
作成が完了したら、現在ルートユーザーでログインしているアカウントからログアウトして、先程作成したルートユーザーでログインします。
ナレッジベースの作成
こちらではS3バケットの作成とBedrockの実装を行います。
最初に紹介したみのるんさんの記事にも書いてありますが、AIに参照させる独自情報として、KDDIアジャイル開発センター(通称KAG)という会社が、「かぐたん」というSlackチャットボットを開発したという最近の内容の文書を使います。
事前準備としてはこちらの文書をPDF化しておく必要があります。
それではナレッジベースの作成を行いたいと思います。
S3バケットの作成
こちらではS3バケットの作成を行います。
S3バケット作成の目的は先程PDF化した社内文書を保存するためのストレージとして作成します。
S3バケットの作成方法についてはこちらも割愛しますが、IAMユーザー作成の時と同じようにコンソール画面からS3を検索して作成を行います。
バケット名はS3バケットの名前は世界中でユニークである必要があるため、何でもいいので被らなさそうなバケット名を設定する必要があります。
S3バケットが作成できたらファイルをアップロードします。
「ファイルを追加」ボタンを押下して、PDFファイルをアップロードします。
余談ですが、AWSの認定試験問題を解いていると、問題文で「S3バケットにファイルをアップロードした際に〜」といった文章を見かけますが、こうやってファイルをアップロードするんですね。こういった発見があるものハンズオンならではですね。
Bedrock側の実装
今回のメインでもあるBedrockの実装を行います。
同じようにコンソールでBedrockと検索を行います。
こちらも詳細は割愛いたしますが、ここでやることとしては
ナレッジベースの作成
生成AIの有効化
になります。
詳しくは初めに紹介した記事を見ていただけたらと思います。
こちらでうまく行くと、S3バケットにアップした社内文書をBedrcokに紐づけているので、Bedrock内部で質問に対して正しい回答を提示してくれます。
アプリケーション開発
ナレッジベースの実装と作成が完了したら最後はアプリ側の実装に入ります。
こちらはCloudShellを利用します。
同じようにコンソール画面でCloudShellを検索します。
尚、この際の注意事項ですが、このCloudShellは新しいタブを開いた上で、実装をしてください。
何故なら、この後Bedrockの画面もまだ使いますので、タブを2つにした方が便利だからです。
こちらも重ねての説明になりますが実装方法の詳細は割愛させていただきます。
起動確認
最後にアプリの起動確認を行います。
上記まで完了すると下記のようなサイトをブラウザで開けるようになります。
ここに「かぐたんって何?」と入力をして、「質問する」ボタンを押すと、S3にアップデートしたPDFファイルの内容がここに記載されます。
それでは「質問する」ボタンを押してみます....
あれ....???
エラーが出ました。
何故だ?手順書通りにやったのにおかしい。
ただこういう時は慌てず、エラー内容を一つ一つ見ていく必要があります。
このエラー文はナレッジベースのIDが存在しないと記載があります。よく確認したら、私はナレッジベースIDではなく、データソースIDを貼り付けていたのです。
その他にもBedrockは東京リージョン、アプリ側のCloudShellはバージニア北部リージョンを使っていました。リージョンが合わないとエラーが出るのは当然ですよね。というわけで、改めてナレッジベースIDを貼り付け、リージョンも統一した上で、再度「質問する」ボタンを押してみました。
おーー!!
今度はうまくいきました!!
普段使っているChatGPTのようなアプリの完成です!
今流行りのBedrock、私も実装できました!
終わりに
いかがだったでしょうか?
AWS完全初心者の自分でも時間はかかりましたが、無事に実装することができました。
私は途中でエラーが出てしまいましたが、エラーを出すことで学ぶことも沢山あると思います。
例えば先程のリージョンが合わないとエラーになるというのも一見当たり前と言えば当たり前かもしれませんが、実際にハンズオンでやってみることで改めて感じられることだと思います。
これまで、座学を通した勉強をやってきましたが、今後はハンズオン学習をより取り入れることで、上位資格合格にも近づくと思います。
そして何よりもアプリを作れたり、イメージしたものを作れると楽しいですよね!
自信にも繋がると思います!
まだ、自分1人で考えて作るのは難しいですが、積極的に手を動かしながらどんどんできることを増やしたいと思います!