2025年2月18日、株式会社レッジ オフィスにて「Qwenで実現するAIエージェント開発ハンズオン」に参加せてもらいました[リンク]。これはそのレポートです。なお、レポートを書いたらちょっとした謝礼をいただけるというので、この記事はちょっとだけプロモーションになります。
Qwen はAlibaba Cloudが開発したオープンソースLLM。様々な規模が選択でき、小規模のものはスマートフォンやPCで動かすことができ、大規模なものは他の大規模LLMに匹敵する性能を持つ。
→ Alibaba Cloud 2024/08/07 Llama3を超えた?4兆円超予算のアリババの研究所が開発したオープンソースLLM「Qwen」
このハンズオンでは、ノーコードAIアプリ開発ツールであるModelStudioを使う。ModelStudioはQwenだけでなく、様々なLLMを使うことができる。
以下、ハンズオンでは、RAGを使った質問応答システムのAPIをAlibaba Cloudにデプロイするまでを作成する。行われた手順を辿ってみる。
- まずベースモデルで同作確認
ベースモデルはiPhone 16が発売される前に構築されたもので、iPhone 16について質問しても、想定される仕様しか答えない。 - 対応するファイルをアップロード
サイドバーメニューData ManagementのImport Dataを用いてファイルアップロード。ここではiPhone 16の技術仕様 (リンク) をPDF化したものをアップロードする。
→ これだけではまだまだiPhone 16に関する情報は質問応答に反映されない。 - アップロードしたファイルの知識化
サイドバーメニューData Application > Knowledge Index から “Create Knowledge Index” 実行
アップロードしたファイルを選択し、インポート
→ まだiPhone 16に関する情報は質問応答に反映されない。 - RAGアプリケーション作成
My Application で”Create Application”
Agent Application の中から “Knowledge Base Retrieval Augmentation”を選択(今見たら “Create RAG Application” を選択
モデル選択: Max/Plus/Turbo/Open がある (どれを使ったか忘れた)
Select Knowledge Base: 2で作成したKnowledge Indexを選択
Prompt Sample LibraryをON
→ iPhone 16に関する質問が回答可能になる。 - その他改良
アップロードした仕様書にはiPhoneの価格は書かれていない → 「iPhoneの価格」という変数をセットすることができる。
複数台のiPhoneの価格を計算させると正しくない値を出す。→ Plug-in GalleryでCalculatorを選択すると、正しい値を出すことができるようになる。 - Publish
API Keyを発行する
呼び出し方が示されているので、上記発行したAPI Keyを使って呼び出し側のアプリケーションに組み込む
Publishはしたものの、時間の関係でAPIの呼び出し側まで作るまでには至っていない。今後、(別のファイルを使って) アプリケーションを作るまで進めてみたい。
ここまで確かにノーコードで進めることができた。生成AIを使うのにプロンプトエンジニアリングに止まっているところにとっては、背中を押してくれる存在になりうると思う。
なお、「Qwenで実現するAIエージェント開発ハンズオン」という表題から、対話を行うだけではなく、人の命令または自主的な判断で (他のアプリケーションと連動して) 処理を実行するものを期待していた。ステップ3でRAGアプリケーションを作るときにAgent Applicationから選んだが、Alibaba Cloudにおいては対話の相手をLLMを使うエージェントと位置付けていることがわかる。
ただし、Agent Application以外に Workflow Application および Agent Orchestration Application という種類がある。これらを用いれば、なんでも任せられるエージェントまでは行かなくとも、例えば旅行代理店のようなある業務に特化したアプリケーションが作れるのではないか。
最後に料金に関して。このハンズオンの最後にインスタンスを削除したので、実質1時間使ったわけだが、料金は発生していない (100ドル分のクレジットをもらったが全く減っていない)。この記事を書くにあたって再度ハンズオンを再実行しているが、その間も減っていない。このインスタンスをもうしばらく生かしておいて、どれくらい消費されるのかをモニターしてみようと思う。