【学習記録 #1】専門特化型AIチャットボットを作りたい! ― AIチャットボットとは?なぜ作るのか
はじめに
健康や医学を独学で学んでいるエンジニアです。大量の学習資料(講義PDF、過去問、Wordまとめなど)を横断検索できる 自分専用のAIチャットボット を作ろうと思い立ちました。
本シリーズでは、構築に至るまでの学習過程を記録していきます。
第1回は「そもそもAIチャットボットとは何か」「なぜわざわざ自分で作るのか」を整理します。
対象読者:エンジニア経験1年程度の方。プログラミングの基本は分かるけど、AI周りの用語にはまだ馴染みが薄い、という方を想定しています。難しい専門用語には注釈を付けています。
この記事で分かる3点を最初に示します。
- AIチャットボットの種類と、なぜ「生成AI型」が主流になったのか
- 自分でチャットボットを作ることのメリット(個人・ビジネス両面)
- 実際の活用事例と、私が作るチャットボットの要件
シリーズ構成
| # | タイトル | 内容 |
|---|---|---|
| #1 | 本記事 | AIチャットボットとは?なぜ作るのか |
| #2 | AIチャットボットの作り方4選とRAG入門 | 構築方法の比較 + RAGの仕組み |
| #3 | Dify × React ハイブリッド構成に決めるまで | アーキテクチャ設計と構築ロードマップ |
1. AIチャットボットとは何か
1-1. ざっくり言うと
AIチャットボットとは、AI(人工知能)を使って、人間と自然な会話ができるソフトウェア のことです。
LINEやSlackのチャット画面のようなインターフェースで質問を入力すると、AIが文脈を理解して回答を返してくれます。最近ではChatGPTやClaude、Geminiなどの LLM1 の登場により、まるで人間と話しているかのような自然な対話が可能になっています。
1-2. チャットボットの進化 -- 3つの世代
チャットボットは大きく3つの世代に分けられます。以下の図で全体像を掴んでください。
ルールベース型(非AI型)
あらかじめ用意した選択肢やフローに従って進行するタイプです。「Aと聞かれたらBと答える」というルールを人間が一つ一つ設定します。決まったパターンの質問にしか対応できません。
ユーザー:「営業時間は?」
ボット :「営業時間は9:00〜18:00です」 ← あらかじめ登録済み
ユーザー:「明日の天気に合わせて行きたいんだけど…」
ボット :「すみません、理解できませんでした」 ← 想定外の質問には対応不可
従来型AIチャットボット
NLP2 を使ってキーワードを抽出し、FAQデータベース3から類似度の高い回答を検索するタイプです。ルールベース型より柔軟ですが、複雑な文脈の理解には限界があります。
生成AI型チャットボット(現在の主流)
LLMを搭載し、ユーザーの質問の意図を深く理解した上で、回答文をその場で「生成」する タイプです。事前にFAQを用意する必要がなく、想定外の質問にも柔軟に対応できます。さらに RAG4 と組み合わせることで、自社の資料や独自データに基づいた正確な回答が期待できます(検索精度や資料の整備状況に依存します)。
1-3. 3世代の比較
3世代の違いを表にまとめます。
| 比較項目 | ルールベース型 | 従来型AI | 生成AI型 |
|---|---|---|---|
| 回答方法 | ルール照合 | FAQ検索 | 文章を生成 |
| 想定外の質問 | ❌ 対応不可 | △ 限定的 | ✅ 柔軟に対応 |
| 事前準備 | ルール設計が必要 | FAQ登録が必要 | プロンプト5設計が中心 |
| 文脈理解 | ❌ なし | △ 限定的 | ✅ 深い理解 |
| RAG連携 | ❌ 不可 | △ 一部可能 | ✅ 高精度 |
生成AI型は非常に強力ですが、事実と異なる回答を生成してしまう「ハルシネーション」6や、API利用コストなどの課題もあります。これらは次回以降で詳しく扱います。
2. なぜAIチャットボットを作るのか
「ChatGPTやClaudeをそのまま使えばいいのでは?」と思うかもしれません。確かに汎用LLMは非常に賢いですが、自分で作る ことには明確なメリットがあります。
2-1. 個人開発者・学習者にとってのメリット
自分の資料に特化した回答が得られる
汎用的なLLMは世の中の一般的な知識には強いですが、「自分の講義ノートに書いてある内容」や「社内マニュアルの記載」は知りません。自分の資料を読み込ませた専用チャットボットなら、その資料に基づいた回答が期待できます。
以下の図が「汎用LLM」と「専門チャットボット」の違いです。
図中の「ハルシネーション」とは、AIが事実に基づかない情報を生成してしまう現象のことです6。
24時間いつでも質問できる「自分専用の先生」になる
例えば試験勉強中、深夜に「太陽頭痛の弁証で使う漢方は?」と質問したくなっても、先生に聞くわけにはいきません。自分の学習資料を読み込ませたAIチャットボットなら、いつでも資料に基づいた回答が返ってきます。
情報の横断検索ができる
何十冊もの教科書やPDFに散らばった情報を、自然な言葉で横断検索できるようになります。「この症状に関連する経穴を全てリストアップして」のような質問に、複数の資料を横断して回答してくれます。
2-2. ビジネスにとってのメリット
企業がAIチャットボットを導入するメリットも整理しておきます。自分でチャットボットを構築できるスキルは、エンジニアとしての市場価値にもつながります。
| メリット | 具体例 |
|---|---|
| 24時間365日対応 | ホテル業界で夜間トラブル対応を自動化 |
| 問い合わせコスト削減 | 小売業で問い合わせ数を大幅に削減した事例もあるとの報告あり |
| 属人化の防止 | ベテランのノウハウをナレッジベース7に蓄積 |
| 対応品質の均一化 | 誰が質問しても同じ品質の回答を提供 |
3. AIチャットボットの活用事例
実際にどのような場面でAIチャットボットが使われているか、いくつかの事例を紹介します。
事例1:社内ヘルプデスク
社内ヘルプデスクにAIチャットボットを導入し、Slackと連携。従業員が話し言葉で質問すると、AIが社内マニュアルを検索して回答する仕組みを構築した事例があります。担当者が手動でマニュアルURLを貼る作業がなくなり、対応工数が大幅に削減されています。
【Before】
社員「VPNの設定方法を教えて」
→ 担当者がマニュアルを探す(5分)
→ URLをSlackに貼る(1分)
→ 社員が読んで質問(10分)
合計: 16分 + 担当者の手が止まる
【After】
社員「VPNの設定方法を教えて」
→ AIが即座にマニュアルから該当箇所を回答(10秒)
→ 社員が追加質問してもAIが対応
合計: 1分以下 + 担当者の手が止まらない
その他の活用事例
| 分野 | 活用内容 | 効果 |
|---|---|---|
| 新人教育 | マニュアルをAIに読み込ませ、新人が自分で調べて学習できる環境を構築 | ベテラン社員の指導負担を軽減 |
| カスタマーサポート | 問い合わせの多くをAIが自動対応し、オペレーターの業務負荷を軽減 | 24時間365日対応が可能になり、顧客満足度が向上したとの報告もあり |
| 行政サービス | 市民の曖昧な言葉(例:「壊れた椅子」)をAIが解析しゴミ分別を案内 | 夜間・休日でも市民が自己解決できる環境を整備 |
4. 私が作るチャットボット
これらの事例を踏まえ、私は 健康・医学の学習資料を読み込ませた専用チャットボット を作ることにしました。国家試験対策で「この症状の主治は?」「この薬の構成は?」といった質問に、自分の資料に基づいて回答してくれるAIを目指します。
私の要件を整理するとこうなります。
| 要件 | 詳細 |
|---|---|
| 資料量 | 数百ファイル(講義PDF、Word、過去問テキスト) |
| 検索方法 | 自然な日本語で横断検索したい |
| 回答の根拠 | どの資料のどこから答えたか表示してほしい |
| 利用時間 | 深夜早朝含む24時間 |
| 将来性 | UIを学習に特化してカスタムしたい |
まとめ
本記事で整理したポイントをまとめます。
- AIチャットボット は3世代の進化を経て、現在は「生成AI型」が主流。事前にFAQを用意しなくても柔軟に対話できる
- AIチャットボットを 「自分で作る」 ことで、自分の資料に特化した回答、24時間対応、情報の横断検索が実現できる
- 社内ヘルプデスクや新人教育など幅広い活用事例があり、私のケースでは鍼灸・東洋医学の大量資料を横断検索できる学習支援チャットボットを目指す
あなたならどんな資料を読み込ませたいですか?
次回は、AIチャットボットの具体的な構築方法4パターンの比較と、その核心技術である RAG(検索拡張生成) の仕組みを解説します。
次回:[学習記録 #2] AIチャットボットの作り方4選とRAG入門
-
LLM(Large Language Model / 大規模言語モデル):膨大なテキストデータを学習し、人間のように自然な文章を生成できるAI。ChatGPT(OpenAI)、Claude(Anthropic)、Gemini(Google)などが代表的。 ↩
-
NLP(Natural Language Processing / 自然言語処理):人間が使う言葉(自然言語)をコンピュータに理解・処理させる技術の総称。「この文の主語は何か」「肯定的な文か否定的な文か」といった解析を行う。 ↩
-
FAQデータベース:「よくある質問と回答」をまとめたデータベース。「Q: パスワードを忘れた → A: リセットページから再設定してください」のようなペアを蓄積する。 ↩
-
RAG(Retrieval-Augmented Generation / 検索拡張生成):LLMに外部データを検索・参照させてから回答を生成させる技術。次回の記事で詳しく解説します。 ↩
-
プロンプト(Prompt):AIに対して入力する指示文や質問文のこと。プロンプトの書き方次第でAIの回答品質が大きく変わるため、「プロンプト設計(プロンプトエンジニアリング)」という分野も生まれている。なお、RAG構成ではプロンプト設計に加えてデータパイプラインの構築も必要になる。 ↩
-
ハルシネーション(Hallucination):AIが事実に基づかない情報をもっともらしく生成してしまう現象。「AIの幻覚」とも呼ばれる。生成AI型チャットボットを利用する際は、回答の正確性を確認する習慣が重要。 ↩ ↩2
-
ナレッジベース:組織や個人が持つ知識・ノウハウをまとめたデータベース。社内マニュアル、FAQ、業務手順書などが該当する。AIチャットボットの「知識の源」として使われる。 ↩