はじめに
皆さん、初めまして!ADiXi アドベントカレンダー18日目 になります!
私自身2025年は生成AIを利用して業務遂行を行うことがあった為、自身が気軽に遊べるAIチャットボットが欲しいと思いAIチャットボットを作成しました。
なお、この記事では環境選定までを記載しています。
この情報は2025年12月時点の情報になります。
前提
- コストはなるべくかけない
- スマホアプリでのやり取りを想定
結論
いきなり結論ですが...
前提をもとに検討した結果、2025年12月時点では...
Cloudflare Workers + Workers AI構成が最強!!
構成図
注意点
なお、注意点もあり下記に気を付ける必要があります。
- 無料枠を超えないようにするブロック機能は個別実装が必要
- Workers AI無料枠で使用できるAIモデルは下記点に注意が必要
- 学習データのカットオフ日が2023年12月
- WebSearch機能がない為、個別実装が必要
構成選定プロセス
構成選定するうえでの比較情報を記載します。
スマホアプリ選定
個人的によく使用するアプリから選定
どちらでもよかったが、完全個人の好みでLineに決定
| アプリ名 | APIサービス名 | 無料枠 | 結果 |
|---|---|---|---|
| Line | LINE Messaging API | 応答メッセージは無料 1 | ✅採用 |
| Discord | Discord API | 完全無料 |
実行環境
よく話を耳にするサービスから選定
ホスティング無料枠+AI無料枠のバランスが良いCloudflare Workers+Workers AIに決定
| ホスティング | ホスティング無料枠 | 統合AI | AI無料枠 | 無料枠で使えるAIモデル | 結果 |
|---|---|---|---|---|---|
| Cloudflare Workers | 10万リクエスト/日 | Workers AI | 1万ニューロン/日 | Llama 3.1 8B/70B Qwen 1.5 7B Mistral 7B Gemma 7B |
✅採用 |
| AWS Lambda | 100万リクエスト/月 | Bedrock | なし | なし(全て従量課金) | |
| Google Cloud Run | 200万リクエスト/月 | Vertex AI | $300クレジット(初回90日) | Gemini 1.5 Pro/Flash PaLM 2 |
|
| Azure Functions | 100万リクエスト/月 | Azure OpenAI | なし | なし(全て従量課金) |
AIモデル比較
無料枠で利用可能AIモデルから選定
日本語対応力と1日の会話回数目安からQwen 1.5 7Bを選定
| モデル | 日本語対応 | トークン効率 | 1日の会話回数目安 | 推論力 | 結果 |
|---|---|---|---|---|---|
| Qwen 1.5 14B | ◎ | ○ | 20〜50回 | ◎ | |
| Qwen 1.5 7B | ◎ | ◎ | 25〜70回 | ○ | ✅採用 |
| Llama 3.1 8B | ○ | ○ | 20〜55回 | ◎ | |
| Gemma 7B | ○ | ○ | 25〜60回 | △ | |
| Mistral 7B | △ | ○ | 30〜80回 | △ |
まとめ
生成AIが発達してきており、だんだんと我々にも身近になってきています。
実際に今回私も生成AIを利用して構築まで実施してみて、構築難易度が大幅に下がったなと感じています。
それゆえに要件をプロンプトに落とし込む言語力や生成AIが出力した回答に対して丸呑みせず判断する技術力が今後より必要になると感じました。
-
プッシュ/ブロードキャストメッセージのみ200通/月まで無料 ↩
