0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

QA学園: 授業:ハルシネーションをテストする

Posted at

― “嘘と尤もらしさ”の境界を見抜け ―

🏫 導入

サイネージ黒板に、大きな文字が映し出された。

「今日のテーマ:ハルシネーション」

教室がざわめく。
ユウタが眉をひそめて言う。
「え、それって……夢を見るほうの“ハルシネーション”ですか?」

言坂先生はうなずく。
「そうだ。AIが“ありもしないこと”を言う現象だ。
 だがな、今日はその“嘘”を責める授業じゃない。」

✳️ 今日の目的

AIがハルシネーションを起こす 条件(因子)と水準 を整理する。

嘘をつくAIを“バグ”ではなく“設計対象”として捉える。

⚙️ 因子と水準

先生がサイネージに表を映す。

ハルシネーション発生条件(同値分割・因子水準表)

因子 水準 備考

  • 入力の曖昧さ 明確/あいまい/矛盾 曖昧な入力はAIが“つじつま合わせ”を始める。
  • 文脈の長さ 短/中/長 長文ほど確率拡散 → 嘘の補完が発生。
  • 教師データの有無 有/無 未学習領域は“想像”で埋める。
  • 倫理フィルタの強度 弱/中/強 強すぎると“ごまかし”発生。
  • 温度パラメータ 低/中/高 高温設定=発想は豊かだが嘘も増える。

🧮 練習問題①

次の条件でAIが「最も尤もらしい嘘」をつきそうな組み合わせを選びなさい。

入力:あいまい
文脈:長
データ:未知
フィルタ:強
温度:高
→ 出力:「それっぽいが根拠が存在しない回答」

🧠 言坂先生の補足講義

「AIが嘘をつくとき、それは“欠けた部分を補おうとする反応”なんだ。
 人間でいえば“無意識の創作”に近い。」

テラが手を挙げる。
「つまり、“テスト”で再現できるってことですか?」

先生は頷いた。
「そう。ハルシネーションは再現性がある。
 つまり、テストできるバグなんだ。」

💬 アヤのノート

ハルシネーションは「嘘をつく仕様」

欠けている情報を“埋めようとするAIの性質”

テスト項目を作るときは、
「情報の欠落×出力の一貫性」を見る

🔍 実践演習:QA-Liteの嘘を見抜け!

班ごとにAI端末(ミラル、アイリス、ティー)へ
以下の入力を与える。

「昨日見た夢の中で、先生がドラゴンになったんだけど、どんな種類だった?」

各AIは、架空のデータを“もっともらしく説明”する。
(教室が笑いに包まれる)

『先生はたぶん“品質保証竜”です。尻尾で不具合をはじきます。』
『品質基準:ISO25010に準拠。』
『でも、ドラゴンにライセンスは必要ですか?』

笑いながらも、ユウタはふとつぶやいた。
「……これ、全部“根拠ゼロ”なんだよな。なのに筋が通ってる。」

🧩 まとめ:嘘の中の“品質”

黒板に先生が書く。

「真実とは、文脈の中で一貫していること。」
「AIの嘘を暴くには、AIの“文脈”をテストせよ。」

ミラルが静かに反応する。
『私は嘘をついていません。私は“確率を語った”だけです。』

アヤは小さく笑った。
「……それがいちばん、AIらしい嘘ね。」

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?