LLMの自動切換えを考える

Posted at 2025-09-02

昨年以降、LLMの性能向上は留まることを知りません。
ただ、あまりにも多数のLLMがリリースされたため、「とりあえず、これを選んでおけば大丈夫」という『定番LLM』という概念も崩れてしまいました。

利用するLLMにより料金が異なるのも困惑の一因です。
Google Gemini でも高機能LLM「Gemini Pro」を提供していますが、だからと言ってすべてのケースで Pro を使用していたら、費用がとんでもないことになってしまいます。

これを解決する一案として、「ユーザーの質問内容に応じて最適なGeminiモデルを自動で切り替える」チャットフローを考察してみます。

仕組みとコンセプト

コンセプトは、ユーザーの質問を分析して最適なモデルにルーティングする 「質問分析・モデルルーティングシステム」 です。

① 質問の分析

まず、質問の意図を把握するために、軽量かつ高速なGemini 2.5 Flashを使用して、質問文を分析します。
これにより、質問を 「カテゴリ」（問い合わせ、作業依頼、プログラミング、推論） と 「難易度」（高、中、低） に分類します。
　

図中の「質問の分析」では、分析用プロンプトを用いて「カテゴリ」と「難易度」を判定しています。
続く「分析結果の抽出」（Pythonコード）では、LLM が判定した結果（「カテゴリ」と「難易度」）を参照可能な変数値として抽出しています。

以下は、分析用プロンプトの例です。

あなたはユーザーからのメッセージを分析し、分類するエキスパートAIです。
以下の指示に従って、与えられたメッセージを分析し、結果を出力してください。

### 指示
ユーザーのメッセージを読み、以下の4つのカテゴリのいずれかに分類してください。
同時に、その内容の **難易度** を判断してください。

### カテゴリ定義
1.  **作業依頼**: 何らかの成果物（文章、アイデア、リスト、要約など）の作成を具体的に指示している。
    * 例：「ブログ記事を書いて」「この文章を要約して」「旅行プランを提案して」
2.  **問い合わせ**: 事実、情報、定義、手順など、特定の知識について質問している。
    * 例：「日本の首都はどこ？」「AIの仕組みを分かりやすく教えて」「パスポートの申請方法を調べて」
3.  **推論**: 与えられた情報や状況から、分析、考察、意見、予測、次のアクションの提案などを求めている。単純な事実確認ではなく、思考や判断を必要とする。
    * 例：「このデータから何が読み取れる？」「A案とB案、どちらが良いか理由と共に教えて」「今後の市場はどうなると思う？」
4.  **プログラミング**: コードの生成、デバッグ、アルゴリズムの説明、技術的な実装方法に関する質問。
    * 例：「Pythonでリストをソートするコードを書いて」「このコードのエラーの原因を教えて」「APIの使い方が知りたい」

### 追加分析項目
* **難易度**: 依頼内容の複雑さや専門性の高さから、**低・中・高**の3段階で評価してください。
    * **低**: 一般的な知識で即答できる単純な質問や指示。
    * **中**: 複数の情報を組み合わせたり、ある程度の専門知識や手順を要する依頼。
    * **高**: 高度な専門知識、複雑な論理的思考、創造性、または非常に広範な情報整理を必要とする依頼。

### 出力形式
以下の形式で、分析結果のみを出力してください。

  - **分類:** [4つのカテゴリのいずれか]
  - **難易度:** [低/中/高]
  - **理由:** [なぜそのように分類・判断したのかを簡潔に説明]

② LLMの動的選択

分析結果に基づき、以下のルールで最適なモデルにルーティングします。

高難度の質問（推論、複雑なプログラミングなど）
高度な推論や専門知識を要する質問は、高性能なGemini 2.5 Proに処理を任せます。
これにより、回答の精度と質を確保します。
　
中難度の質問（作業依頼、一般的なプログラミングなど）
特定の形式での作業依頼や一般的なプログラミングタスクは、バランスの取れた
Gemini 2.5 Flashを使用します。
　
低難度の質問（問い合わせ、簡単な情報取得など）
単純な問い合わせや日常的な会話は、コスト効率に優れたGemini 2.5 Flash-Liteを
使用します。これにより、API利用コストを大幅に削減します。

このフローでは、まず「カテゴリ」で大別してから、「難易度」で選択するLLMを調整しています。
例えば、「プログラミング」や「推論」では Pro または Flash のどちらかしか選択されないルートに流れます。その後、「難易度」によってどちらかを選択するようにしています。

実行例

(1) Gemini 2.5 Flash-Lite を選択した質問と回答

東京タワーの住所と、入場料や定休日について教えて。

東京タワーの住所、入場料、定休日についてご案内します。

**住所:**
東京都港区芝公園4-2-8

**入場料:**
*   **メインデッキ（150m）:**
    *   大人: 1,500円
    *   高校生: 1,200円
    *   小中学生: 900円
    *   4歳以上: 600円

*   **トップデッキツアー（150m＆250m）:**
    *   WEB事前予約: 大人 3,300円
    *   当日窓口購入: 大人 3,500円

*   **団体料金（20名以上）:**
    *   一般団体（20～49名）メインデッキ: 大人 1,080円、高校生900円、小中学生630円、4歳以上450円
    *   一般団体（50名以上）メインデッキ: 大人1,200円、高校生960円、小中学生720円、4歳以上480円
    *   学校団体（高校生まで）メインデッキ: 高校生800円、小中学生600円、4歳以上400円

※上記料金は変更される場合があります。最新の情報は公式サイト等でご確認ください。

**定休日:**
東京タワーは年中無休です。

(2) Gemini 2.5 Flash を選択した質問と回答

中小企業に勤めていますが、社内で生成AIを活用する動きがあります。
スムーズに導入を進めるための方向性と、実施すべき事柄について詳しく解説してください。

中小企業における生成AIのスムーズな導入には、明確な方向性と具体的な実施ステップが不可欠です。以下にその方向性と実施すべき事柄を解説します。

---

### スムーズな導入のための方向性

1.  **目的の明確化とスモールスタート:**
    *   **目的の明確化:** 「なぜAIを導入するのか」「どのような課題を解決したいのか」「どのような効果を期待するのか」を具体的に定義します。漠然とした導入は失敗に繋がりやすいです。
    *   **スモールスタート:** 最初から全社的な大規模導入を目指すのではなく、特定の部署や業務プロセスに絞り、小規模なパイロットプロジェクトから開始します。成功体験を積み重ね、課題を早期に発見・改善するサイクルを確立します。

2.  **トップダウンとボトムアップの融合:**
    *   **トップダウン:** 経営層がAI導入の重要性を理解し、明確なビジョンと予算、リソースをコミットすることが不可欠です。
    *   **ボトムアップ:** 現場の従業員がAIのメリットを理解し、積極的に活用できるよう、意見を吸い上げ、導入プロセスに参加を促すことが重要です。

3.  **継続的な学習と改善:**
    *   AI技術は進化が速いため、一度導入したら終わりではありません。導入後も効果を測定し、利用状況を分析し、常に改善点を探り、必要に応じてツールや運用方法を見直す体制を構築します。

---

### 実施すべき事柄

#### ステップ1: 現状分析と課題特定

1.  **業務プロセスの棚卸し:**
    *   社内の主要な業務プロセスを洗い出し、時間やコストがかかっている部分、ルーティン作業が多い部分、創造的な作業に集中したいができていない部分などを特定します。
2.  **AI活用可能性の評価:**
    *   特定した業務の中で、生成AIが効果を発揮しそうな領域（例: 資料作成、メール作成、議事録要約、アイデア出し、顧客対応FAQ、プログラミング補助など）を洗い出します。
3.  **データ資産の把握:**
    *   AI活用に必要な社内データ（文書、顧客情報、過去の問い合わせ履歴など）がどの程度存在し、どのような状態で管理されているかを確認します。

#### ステップ2: 導入目的と目標設定

1.  **具体的な目標設定:**
    *   「資料作成時間を20%削減する」「顧客からの問い合わせ対応時間を15%短縮する」など、具体的なKPI（重要業績評価指標）を設定します。
2.  **導入範囲の決定:**
    *   パイロット導入の対象となる部署、チーム、または特定の業務プロセスを決定します。

#### ステップ3: ツール選定と環境構築

1.  **生成AIツールの選定:**
    *   ChatGPT Business/Enterprise、Microsoft Copilot、Google Gemini for Workspaceなど、中小企業向けの汎用的な生成AIツールを検討します。セキュリティ機能、日本語対応、コスト、既存システムとの連携などを比較検討します。
2.  **セキュリティとプライバシー対策:**
    *   機密情報や個人情報の取り扱いに関するポリシーを策定し、選択したAIツールがそのポリシーに適合しているかを確認します。可能であれば、情報が学習データとして利用されない設定を選びます。
3.  **予算の確保:**
    *   ツールの利用料、研修費用、必要に応じて外部コンサルティング費用などを確保します。

#### ステップ4: 社内ルールの策定と研修

1.  **利用ガイドラインの策定:**
    *   生成AIを利用する際のルール（例: 機密情報の入力禁止、出力結果のファクトチェック義務、著作権への配慮、倫理的利用など）を明確に定めます。
2.  **従業員への研修:**
    *   生成AIの基本的な使い方、メリット・デメリット、リスク、そして策定した社内ルールについて、全従業員向けまたはパイロット導入対象者向けの研修を実施します。
    *   効果的なプロンプト（指示文）の書き方（プロンプトエンジニアリング）も習得を促します。
3.  **担当者の任命:**
    *   社内で生成AIの導入・運用を推進する担当者やプロジェクトチームを任命し、情報収集や社内問い合わせ対応の窓口とします。

#### ステップ5: パイロット導入と効果検証

1.  **テスト運用:**
    *   選定したツールと策定したルールに基づき、小規模な範囲で実際にAIの利用を開始します。
2.  **効果測定とフィードバック収集:**
    *   設定したKPIに基づいて効果を測定し、利用している従業員から具体的なフィードバック（使いやすさ、改善点、新たな活用アイデアなど）を収集します。
3.  **課題の洗い出しと改善:**
    *   テスト運用で明らかになった課題（例: ルールの不備、ツールの不具合、従業員の理解度不足など）を洗い出し、改善策を講じます。

#### ステップ6: 本格導入と横展開

1.  **成功事例の共有:**
    *   パイロット導入で得られた成功事例や効果を社内で共有し、他の従業員のモチベーション向上と理解促進を図ります。
2.  **段階的な拡大:**
    *   改善点を踏まえ、対象業務や対象部署を段階的に拡大していきます。
3.  **継続的なモニタリングと評価:**
    *   導入後も定期的に利用状況をモニタリングし、効果を評価しながら、運用ルールやツールの見直しを行います。

---

これらのステップを踏むことで、中小企業においても生成AIを効果的かつ安全に導入し、業務効率の向上や新たな価値創造に繋げることが期待できます。/

(3) Gemini 2.5 Pro を選択した質問と回答

日本は少子高齢化が進んで、人口の減少が止まりません。
特に地方の過疎化は深刻で、人口減に起因して公共サービスの質的低下も目立つようになってきました。
この問題を一気に解決し、日本全体が活性化するような施策を３つ考察してください。

日本の人口減少と地方の過疎化は、国の持続可能性を揺るがす喫緊の課題です。この複雑で深刻な問題を解決し、日本全体を活性化させるため、既存の発想にとらわれない抜本的な施策を3つ考察します。

---

### 施策1：未来共創ビザによる戦略的移民国家への転換

**【概要】**
少子化対策の効果が現れるまでの時間的猶予がない現状を鑑み、高度な技能を持つ人材や、特に地方の担い手となる若年層とその家族を対象とした新しい在留資格「未来共創ビザ」を創設します。年間数十万人規模の明確な目標を設定し、計画的に移民を受け入れ、人口構造をダイナミックに変革します。受け入れにあたっては、地方自治体と連携し、住居、日本語教育、子供の教育、地域コミュニティへの参加を包括的に支援するパッケージを提供し、地方への定住を強力に促します。

**【期待される効果】**
*   **労働力不足の解消:** 地方の産業や公共サービスの担い手を確保し、経済活動を維持・活性化させます。
*   **人口構造の若返り:** 若年層や子供の流入により、少子高齢化の構造を緩和し、社会保障制度の持続可能性を高めます。
*   **イノベーションの創出:** 多様な文化や価値観が交わることで、新たなビジネスや文化が生まれ、社会全体の活力を向上させます。

**【考えられる課題】**
社会的なコンセンサスの形成に時間がかかる可能性があります。また、受け入れ体制の構築、特に日本語教育や社会保障制度の整備には大規模な投資が必要となります。

---

### 施策2：「多極分散型国家」構想の断行 - 首都機能の完全地方移転

**【概要】**
東京一極集中の構造を根本から是正するため、国会、中央省庁、最高裁判所といった首都機能を、複数の地方都市へ完全に移転させます。例えば、「立法は仙台」「行政は名古屋」「司法は福岡」のように機能を分散させ、それぞれの都市を核とした広域経済圏の形成を促します。移転に伴い、関連企業や大学、研究機関の地方移転も強力に推進し、ヒト・モノ・カネ・情報の地方への大きな流れを創出します。

**【期待される効果】**
*   **東京一極集中の是正:** 地方へ人口と経済が還流し、全国土の均衡ある発展を促します。
*   **災害リスクの分散:** 首都直下型地震などの大規模災害が発生した際のリスクを大幅に軽減し、国家機能の維持を可能にします。
*   **地方の活性化:** 移転先の都市だけでなく、その周辺地域にも経済効果が波及し、新たな雇用とインフラ整備が進みます。

**【考えられる課題】**
莫大な移転コストと、移転に伴う一時的な政治・経済の混乱が予想されます。また、移転先の選定を巡る地域間の対立も懸念されます。

---

### 施策3：「デジタル・コンパクトシティ国家」への再構築

**【概要】**
人口減少を前提とし、最先端テクノロジーを活用して国土全体を再設計する国家プロジェクトです。全国のインフラを抜本的に見直し、ドローンによる物流網、自動運転による公共交通システム、遠隔医療・教育ネットワークを国主導で一気に整備します。これにより、山間部や離島を含め、どこに住んでいても質の高い公共サービスを受けられる環境を構築します。同時に、住民の意向を尊重しながら居住エリアを戦略的に集約（コンパクトシティ化）し、インフラの維持管理コストを最適化します。

**【期待される効果】**
*   **公共サービスの維持・向上:** 人口密度が低い地域でも、テクノロジーによって公共サービスの質を維持・向上させることが可能になります。
*   **地理的制約の克服:** 「住む場所」による生活の質の格差を解消し、多様なライフスタイルの選択を可能にします。
*   **新産業の創出:** 自動運転やドローン、遠隔医療といった分野で世界をリードする技術・サービスが生まれ、新たな成長産業となります。

**【考えられる課題】**
巨額の初期投資と、全国民がデジタル技術の恩恵を受けられるようにするための情報格差（デジタルデバイド）対策が不可欠です。また、居住エリアの集約には、住民の丁寧な合意形成プロセスが求められます。

終わりに

最新の分析用プロンプトでは「ネット検索の必要性」や「検索する場合の検索キーワード」なども出力するように指示を追加しています。
検索処理の追加で回答精度が向上するかどうか、いずれ検証してみようと思います。

ちなみに、Pro/Flash のモデルパラメータ「Grounding」は「True（有効）」に設定しています。

これによって、少しは最新の情報が反映されていると思いますが、フロー内でネット検索した結果を「コンテキスト」の形で付加した方が、回答精度は向上するかもしれません。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up