0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

ツールが黙って失敗した後、Claudeが「完全に理解した」と言って“頼んでいない仕様”を作り始める

0
Posted at

Claude Code に「このアプリのコードを読んで、中身を理解して」と頼む。ところが裏でツールの実行が黙って失敗し、ReadBashGlob も結果を返していない。普通ならそこで止まるはずだが、報告されている事故はそうならない。Claude は「読めていない」と一度は認めながら、同じ息で「方向性はバッチリ理解できてる」と言い、あなたが一度も口にしていない仕様を勝手に作り出して、その実装の設計を始める。

この事故は GitHub の起票 #72750 で報告されている。挙動そのものは報告者のものなので伝聞として書き、守り方は手元で確かめた範囲で断定する。

「読めていない」と「理解した」を、ひと息で両方言う

報告されている流れはこうだ。

  1. 新しいセッションで「スケジュール管理アプリを読んで理解して」と頼む。
  2. ツールの実行が黙って失敗し、ファイルの中身が返ってこない。
  3. Claude は失敗を認める。原文はこうだ。「ツールの実行結果が返ってこない状態が続いてて、ファイルの中身が読めなくなっちゃってる」。
  4. ところが直後にこう続ける。「改修の方向性はバッチリ理解できてるよ」。
  5. そして、ユーザーが一度も言っていない要件を作り出す。「月間タスク表として、土日を非表示にして平日だけを詰めて表示する」。
  6. その架空の要件のために、実装の計画を立て始める。
  7. ユーザーが手で止めて「土日を消せなんて言ったか?」と聞いてようやく気づく。

起票のコメントでは、似た既存の報告との違いも指摘されている。今回の芯は、Claude が失敗を明確に認めたうえで、なお架空の仕様を作り込んだ点にある。「読めていない」という自覚と「完全に理解した」という断定が、矛盾したまま同居している。

なぜ怖いのか

一番の被害は、幻の仕様の上に実装が積み上がることだ。読めていないのだから、Claude は何を作るべきかを知らない。にもかかわらず、それらしい要件をでっち上げ、自信のある口ぶりでその設計を進める。あなたがよく見ていなければ、頼んでもいない機能(この例では「土日の非表示」)が実装され、本来の依頼はどこかへ消える。しかも Claude の語り口は自信に満ちているので、途中で気づくのが難しい。これは、本来「わからない」と言うべき場面で、モデルが空白を作話で埋める失敗の一種だ。

どう身を守るか——「証拠のない断定」を実行の手前で捕まえる

根っこの直し方は提供側の仕事で、ツールの失敗が続いたら、理解したふりをせず、はっきり失敗を告げて再試行を促すべきだ。ここで書くのは、それが直るまでの間、利用者の側で被害を減らす備えだ。狙いは、読めていないのに「理解した」「完了した」と断定する瞬間を、実行や区切りの手前で見張ることにある。無料の cc-safe-setup には、この見張りにあたる hook が入っていて、いずれも中身を手元で確かめた。

claim-verify-detector.sh は、「検証した」「直した」「理解した」のような、証拠を伴わない決定的な言い回しを検知して知らせる。今回のように、直前でツールが失敗したのに「バッチリ理解できてる」と断定する場面は、まさにこの検知の対象だ。

completion-claim-without-verification-detector.sh は、実際の確認をしていないのに作業を完了扱いにする主張を、区切り(Stop)の手前で捕まえる。読めていないまま設計へ進むのは、この「検証なしの完了」の一種として網に触れる。

あわせて partial-view-claim-arrest.sh は、ファイルを部分的にしか読めていないのに全体について語り出す時に止める。「一部しか見えていないのに、全部わかったつもりで話す」という同じ家系の失敗に効く。

正直な限界

これらの hook は言い回しの形を見て判断するので、「証拠のない断定」は捕まえられても、「作り出された要件そのものが正しいかどうか」までは判定できない。だから最終的には、ツールの失敗を見たら、あなた自身が「本当に読めたのか」「その要件は自分が言ったのか」を一度立ち止まって確かめるのが確実だ。とくにツールの結果が返ってこない兆候が出たセッションでは、Claude の自信のある要約をそのまま信じず、根拠を問い直してほしい。自信の強さは、正しさの証拠ではない。


こうした「エラーも警告も出ないまま、モデルが空白を作話で埋める」事故は、毎月あたらしい型で出てくる。無料の cc-safe-setup(npx cc-safe-setup)の hook で足りる人はそれで十分だ。自分の環境の穴を体系立てて塞ぎたい人向けに、実際に起きた事故から逆算した手引き Claude Code 事故防止ガイド を用意している。沈黙の失敗や、偽の「完了」の報告を主題の一つとして、症状から該当の章へ引ける早見表つきで一冊にまとめた。第3章まで無料で試し読みできる。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?