この記事は、Lancers(ランサーズ) Advent Calendar 2024 の16日目の記事です。
はじめに
こんにちは!
ランサーズ株式会社の宮本です。
AWSの生成AI系のソリューションを調べていたところ、Amazon Bedrockを使用した面白しろそうなソリューションがあったので、試してみました。
ランサーズのサイトで公開されている求人情報のデータを取り込んで、RAGチャットでお仕事探しができるか試してみましたので、ご紹介させていただきます。
使用したソリューション
今回の検証では下記のソリューションを使いました。
AWS上に社内システムを構築していて社内に業務データがあるような企業で、生成AIを使って情報整理したいニーズに応えられそうなソリューションです。
下記にてソースコードやデプロイの方法などがまとまっています。
デプロイ方法について
基本的には上記 Github の中で紹介されているワークショップの手順でデプロイできました。
1から始めて、同期するデータの量やS3上にデータがあるかにもよると思いますが、大体1時間程度あればデプロイが完了してRAGチャットを使用し始めることができました。
デプロイ時のいくつかのポイントとして、下記の点をあげておきます。
・Amazon Kendra はお高いので Amazon Bedrock の Knowledge Base を選択
・CloudFormation では Amazon Kendra のRAGチャットしか使用できなそうだったので、CDKでデプロイした
・Knowledge Baseを使いたかったので、「2-b.3-b. Knowledge Base の手順」の設定をした
・「3. RAG 用データの追加」で S3 ではなく、プレビュー版の Web Crawler を設定した
3点目の Web Crawlerの設定については、Amazon Bedrock のナレッジベースに新規でデータソースを追加して、データソースに Web Crawlerを設定しました。
Web Crawler 選択後、ソース URLを指定できるので、「https://lancersagent.com/project/」を指定して、ランサーズエージェントのサービスで公開されている案件を対象にクロールするように設定しました。
データソース追加後、同期を行うとクロールを開始してサイトに公開している情報を自動で取得し、同期が完了したら、RAGチャットを使用する準備の完了です。
RAGチャットでのお仕事探し
実際にRAGチャットでお仕事探しをしてみましたが、なんかそれっぽい回答を出してくれています。
回答の最後に、ソースとなっているページのリンクが出力されるのですが、2番目の案件に下記のページが出力されていました。
ちょっと上手く出力された例だけの紹介にしておきますが、プロンプトの工夫次第では、大まかにどんな案件があるか探すような時に使えそうな感じでした。
終わりに
今回試したソリューションでは、S3のデータソースも使用できるため、S3上に業務データがある場合は、比較的容易にRAGチャットを使用して欲しい業務データへアクセスすることができます。
また、今回私が試したように、WEB上で公開されているデータを対象にRAGチャットで必要なデータを探すこともできます。
今回は調査しませんでしたが、プロンプトエンジニアリングをもう少し勉強すれば、精度高く欲しいデータにアクセスできそうな感触でした。
AWSの生成AIソリューションに対するプロンプトエンジニアリングについては、下記のドキュメントにもまとまっているので、こちらも勉強した上で今後も試してみたいと思います。
生成AIも身近になってきており、業務での活用も求められるシーンが急激に増えてきています。
今回検証したソリューションは、必要な技術要素が比較的少ないので、色々な方に今回紹介したソリューションをお試しいただければ幸いです。
Lancers では、一緒に働けるメンバーを募集しています!
https://recruit.jobcan.jp/lancers01/list/all/all