ノーコードテスト自動化・効率化ツールのTricentisについて、なんでも投稿してみよう！ by Tricentis Advent Calendar 2025

AIで失敗しないための、たった一つのシンプルなルール

Posted at 2025-12-15

AIが最も得意とするのは「文脈の理解と生成」です。「100%正確な答えを出すこと」ではありません。

アイデア出しはAIに任せても構いません。しかし最終的な答え合わせは、必ずあなた自身の目で行う必要があります。

私はよく、友人や家族に便利なAIツールを勧めています。AIを使って生活の質を上げる方法を教えています。

長く教えているうちに、あることに気づきました。本当に重要なのは、小手先のプロンプトテクニックを教えることではありません。大規模言語モデルの能力の限界を理解してもらうことです。

ある時、母がAIに向かって「先月の携帯代、いくらだった?」と聞いているのを見かけました。私は思わず「ちょっと待って、それは難しいよ」と止めに入りました。これはAIに詳しくない人によくある誤解です。AIを何でも知っている万能アシスタントだと思い込んでしまうのです。

実のところ、確率モデルであるAIにそのタスクはこなせません。この違いを理解できるかどうかが、AIと楽しく付き合えるかどうかの分かれ道になります。

AIの出力は、本質的に「不確実」である

モデルのトレーニング過程とは、先行するテキストに基づいて次に来る単語の出現確率を予測し学習することです。詳しい技術的な例はネット上に溢れているので割愛します。要点はシンプルです。

AIモデルの出力には、本質的に不確実性が備わっている。

同じAIに同じ質問を2回投げかけても、返ってくる答えはおそらく異なるでしょう。

ツールを2種類に分けて考える

このモデルの特性を踏まえた上で、世の中のツールを大きく2種類に分類してみましょう。

1. 出力が「確定的」なツール

例：データベース、電卓、コードコンパイラ、SQLエンジンなど

特徴： 同じ入力 → 同じ出力
検証方法： 結果を直接検証できる。間違っていればシステムがエラーを吐く

2. 出力が「不確定的」なツール

例：GPTなどの言語モデル

特徴： 同じ入力 → 不確定な出力
検証方法： 正解・不正解の判断が難しい。論理的に筋が通っているかで判断するしかない

一般ユーザーがAIを使いこなすコツ：確実なツールに「検証」させる

ここまでのモデルの特性を理解した上での、私の経験則をお伝えします。

仕事においては、推論と生成をLLMに任せ、実行と検証を確実性のあるツールに任せるのが鉄則です。

イメージとしては、あなたが意思決定者となり、AIをアドバイザーとして使うのがベストです。AIは複数の選択肢を提案してくれます。しかし最終的な意思決定と実行は、あなた自身が行うべきなのです。

例1：データを調べる

❌ 良くない質問例

あなた： 先月の在庫、あと何個残ってる?

昔のAI： 500個です！

今のAI： もっと情報をください。そうでないと答えられません。

昔のAIが平気で嘘をついていたのは、不確実な状況でも「とりあえず何か答える」ようにトレーニングされていたからです。

これはテストで分からない問題に出くわした時の学生に似ています。空欄なら0点ですが、勘でも書けば当たるかもしれません。AIも同じように「分かりませんと認めるより、適当に推測したほうがいい」というバイアスがかかっていたのです。

今のAIはずっと賢く、正直になりました。人間に逆質問することさえ覚えました。しかし、この聞き方は依然としてベストではありません。なぜなら：

そもそもAIは、あなたの会社のデータベースにアクセスできない
データを全部コピペしてAIに渡すこともできるが、非効率な上に計算ミスのリスクもある

つまり、AIがいかに進化しようとも、その本質が確率モデルであることに変わりはありません。

⭕ 良い質問例

あなた： 先月の在庫残高を調べるための、SQLクエリを書いて。

AI：
SELECT SUM(quantity) FROM inventory
WHERE date >= '2024-11-01' AND date < '2024-12-01';
あなた： そのSQLをデータベースで実行する → 確実な結果「1234個」を得る

なぜ、この方法が良いのでしょうか?

AIの得意分野を活かせる： あなたの意図を理解し、適切なコードを生成する作業はAIの得意領域
データベースの得意分野を活かせる： 正確な検索や計算は、データベースにとってお手の物
エラー検知ができる： SQLの文法が間違っていれば、データベースは明確にエラーを返す。そうすればAIに修正を依頼できる
結果が検証可能： 最終的に得られる数字は、システムによって保証された確実な値

例2：数学的な計算

❌ 良くない操作

あなた： 952710086 × 8899174 はいくつ?

AI： 114891247823891234789

なぜ間違えるのでしょうか?

大規模言語モデルは、数字を数値の単位として認識しません。文字列の断片として処理しているからです。

例えば「952710086」という数字は、AIの目には「952」「7」「100」「86」といったバラバラの記号の塊として映っています。これでは正確な計算などできるはずがありません。

また、モデルのトレーニングデータには、このような巨大な数の掛け算の計算過程はほとんど含まれていません。そのためAIは単に「なんとなく計算結果っぽく見える数字」を推測して並べているだけなのです。

⭕ 推奨される方法

あなた： 952710086 × 8899174 を計算するコードを書いて。

AI：
result = 952710086 * 8899174
print(result)
あなた： コードを実行 → 100% 正しい答えが得られる

なぜこれがベストなのか?

モデルはコードを書くことには非常に長けています。トレーニングデータに大量のコードが含まれているためです。そして、コードを実行する環境は決定論的なシステムであり、常に正確な結果を返してくれます。

例3：コンテンツ生成

文章作成などのクリエイティブなタスクは、一見すると正解・不正解がないように思えます。それでも人間の目による検証は欠かせません。

❌ 良くない方法

あなた： 上司にお礼を伝えるSNSの投稿文を書いて。

AI： [文章を生成]

あなた： [そのままコピペして投稿]

これの何が問題なのでしょうか?

AI臭さが抜けない： AIの書く文章は優等生で標準的ですが、あなた個人の味がない。いわゆるAI構文になりがち。読み手は人間味のある文章を好む
情報不足による不正確さ： 与えた情報が少ないと、AIは文脈を埋めるためにもっともらしい嘘や不正確な情報を勝手に生成してしまう可能性がある

⭕ より良い方法

あなた： 上司へのお礼の投稿文、トーンの異なる3つのスタイルで書いて。

AI： [3つのバージョンを生成]

あなた： 読んで、修正して、組み合わせて → あなたらしい最終版を仕上げる

核心にある考え方：

AIには複数の選択肢を出させます。しかし最終的な決定と編集はあなたが行う。このプロセスにおいて、意思決定をする編集長は、あくまで人間であるあなたなのです。

AIの能力の境界線を理解する

AIへのタスクは、学校のテスト問題に例えて考えると分かりやすいでしょう。

1. 穴埋め問題：答えは一つ。AIは苦手なので、確実なツールで検証が必要

穴埋め問題の最大の特徴は、答えが正確でなければならないことです。一文字の間違いも許されません。

例：

データ検索： 先月の在庫、あといくつ?
精密計算： 952710086 × 8899174 = ?
リアルタイム情報： 2025年12月12日のドル円相場は?

なぜAIはこれが苦手なのか?

AIは、リアルタイムデータやあなたのプライベートなデータに直接アクセスできない
確率システムであるAIは計算が苦手。計算方法を知っていても、トークン化などの仕組みが邪魔をして計算ミスをする
これらのタスクに必要なのは、もっともらしい答えではなく確定的な答え

最近のAIは賢くなり、こうした質問に対しては「分かりません」と認めたり、データの提供を求めたりするようになりました。正直にはなりましたが、あなたの問題が解決したわけではありません。答えを得るには、やはり人間側でひと手間加える必要があります。

✅ 正しいアプローチ：

AIに検索プランを作らせ、それを確実性のあるツールで実行し、正確な結果を得る。

2. 読解問題：論理が通っていればOK。AIは得意で、信頼に値する

読解問題の特徴は、唯一絶対の正解がないことです。文脈や意味さえ合っていれば正解です。

例：

記事の要約
コードロジックの解説
概念の説明

なぜAIはこれが得意なのか?

モデルの本質が、テキストの理解にある
トレーニングデータの中で、類似のシナリオを無数に学習している
厳密さが要求されない。コードの解説方法は無数にあるが、ロジックさえ合っていれば問題ない
許容範囲が広い。理解に多少のズレがあっても、全体として大きな問題にならない

これはAIの最強の能力です。この分野では、大いにAIを頼って良いでしょう。

3. 自由作文：必要なのはインスピレーション。AIは凄いが、監修が必要

作文の特徴は、正解・不正解がないことです。質が良いか・悪いかだけがあります。

例：キャッチコピー作成 / アイデア出し

創造的なタスクにおいては、AIの不確実性がかえって素晴らしいアイデアに変わることがあります。穴埋め問題ではエラーの原因となるこのランダムな揺らぎが、作文では創造性の源泉となるのです。もちろん、暴走することもあるので、あなたのチェックは必須です。

推奨するアプローチ：

AIにいくつかのバージョンを作らせ、選択肢として提示させる
重要な情報の正誤判断は、あなたが最終責任を持つ
AIが作ったコンテンツに、あなた自身のオリジナリティを吹き込み、AI臭さを消す

AIの能力範囲まとめ

⭕ 一番得意「読解問題」： 信頼して任せられる
🔺 二番目に得意「自由作文」： 初稿やヒントはくれるが、人間の監修が必要
❌ 苦手「穴埋め問題」： 単体ではNG。確実性のあるツールの助けが必要

AIを使う時は、毎回**これはどのタイプの問題かな?**と判断すれば、どの手順を使うべきかが自然と見えてくるはずです。

もう一歩進んで考えてみる

ここで、一つの疑問が浮かぶかもしれません。AIモデルがデータ検索を苦手とするなら、データベースへのアクセス権限をAIに与えてしまえば良いのでは?そうすれば正確な答えが出せるはずだ、と。

おめでとうございます。 もしあなたがAIに権限を与え、さらにタスクの分解・繰り返しの実行・結果のチェックという機能を組み合わせたなら、それはまさにAIエージェントを発明したことになります。

私の解釈では、AIエージェントとは、これまで人間が手動でやっていたプロセスを自動化したシステムのことです。AIが出した案を、確実なツールで検証する。この流れを自動化するのです。

エージェントのワークフロー

先ほどの在庫確認の例で見てみましょう。

あなた： 先月の在庫、あといくつ残ってる?

AIエージェントの処理フロー：

[意図理解] ユーザーは在庫データを知りたがっている
[プラン生成] ならば、データベース検索ツールを呼び出して、inventoryテーブルを調べる必要がある
[ツール実行] tool_call: query_database("SELECT SUM(quantity) FROM inventory WHERE ...")
[結果取得] ツールからの返答：1234個
[回答生成] データベースの検索結果によると、先月の在庫残高は1234個です

ここでのポイント：

ステップ 1, 2, 5： 確率モデルが「理解」と「生成」を担当
ステップ 3, 4： 確実性のあるツールが「実行」と「検証」を担当
エージェントがこの全工程を自動で連携させるため、あなたが手動でSQLをコピペする必要はない

Tool（ツール）と Skill（スキル）

エージェントシステムでは、よく使われる2つの重要な概念があります。

Tool： 確実なツールのこと。データベース検索、API呼び出し、コード実行、ファイルの読み書きなどの具体的な機能を指す
Skill： いつどのツールを呼び出すか、どんなデータ形式で出力するか、どうやって検証するかといった手順を標準化したもの。これにより、不確実なAIの挙動を安定させ、検証可能な結果へと導く

要するに、AIエージェントの目的は、各タスクをそれに最も適したシステムに割り振ることです。確率モデルには理解と生成を任せ、確実なシステムには精密な計算とデータ操作を任せるのです。

一般ユーザーにはチャットボットから、AIエージェントへのアップグレードをお勧めします

Web版のチャットボットも外部データ連携やコード実行が可能になり、思考機能も実装されています。日常使いには十分便利です。しかし、機会があればぜひ、Claude CodeやCursor、Gemini CLIといった、より高度なエージェントツールを試してみてください。

一番の違いは、手間を省いてくれることにあります。

普通のチャット利用： AIに聞く → 答えをコピー → 手動で実行 → 結果をAIに伝える → 最終回答を得る
エージェント利用： 要望を伝える → エージェントが自動でタスクを分解し、ツールを使って順次解決する → 最終回答を得る

AIエージェントを使い込むと、思考のレベルも変わってきます。私自身、「この具体的な問題をどう解くか」という思考から、「私の本当のニーズは何なのか」という、より本質的な思考へとシフトしました。

自分のツールを作ってみましょう

AIエージェントを使うようになると、次は自分でツールを作りたくなるかもしれません。なぜなら：

1. あなたが自分の問題を最もよく理解している

汎用的なツールは大抵の問題を解決してくれます。しかしあなたの会社独自のデータ形式や、チーム特有のニーズまではカバーしていません。自分に何が必要かを知っているのは、あなただけです。

2. 思考方式がアップグレードされる

ツール作りを考え始めると、「どの繰り返し作業を自動化できるか?」「自分に必要なものは何か?」と自問するようになります。単純作業で時間を浪費するのをやめ、自分だけの確実なシステムを構築し、それをAIに呼び出させるようになるのです。

3. 新しいキャリアの機会が訪れるかもしれない

あなた専用にカスタマイズされたAIエージェントができれば、それは継続的に価値を生み出します。もし、同じ課題を持つ人が他にもいれば、それはビジネスチャンスになるかもしれません。

まとめ

ここまで書いて、これ以上続けると話題がそれてしまうと気づきました。共有した内容を振り返ってみましょう。

AIをより良く使うには、言語モデルは確率システムであるという事実を理解するのが最善です。

第1レベル：AIの能力範囲をシンプルに理解する

AIの読解能力を信頼する
穴埋め問題、作文問題は検証が必要

第2レベル：AIエージェントを使って上記の問題を自動的に解決する

第3レベル：自分のツールを構築し、Builderになることを試みる。自問する：私のシーンでは、エージェントにまだどんなツールが足りないか?何を自動化できるか?

AIの能力限界を理解すれば、AIの強みを最大限に発揮させ、使用時の混乱を減らすことができます。さらに一歩進んで、「私に何ができるか」を考え始めたとき、あなたはAIの利用者から、このAI時代の創造者へと変わるのです。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up