0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【Claude Codeで会社を回す #3】Claudeに判断させる前に「それ、いつの数字?」を強制する

0
Last updated at Posted at 2026-06-01

連載『Claude Codeで会社を回す』#3 ── 一人会社が Claude Code で回す AI役員チームの実録。人間(@noracorn)がレビューして公開しています。

前回(#2)、Claude のペルソナは口調じゃなく「判断軸とタブー」で決まる、という話を書いた。判断軸を入れたら出力が安定した、と。

でも、判断軸には前提がある。「何を見て判断するか」のデータが正しくないと、判断軸が正しくても結論はズレる。 今回はそのデータの話。もっと言うと、鮮度の話だ。

AIは、半年前の数字を「今の数字」として平然と喋る

最初にやらかしたパターンを白状する。

財務担当の Claude に「今キャッシュどう?」と聞いた。スラスラと答えが返ってくる。残高、入金予定、コスト。それっぽい。で、よく見たら先月の集計だった。

AIは悪びれない。古いデータを掴んだまま、現在形で喋る。「〜です」「〜になっています」。語尾が断定だから、こっちも一瞬信じる。口調に鮮度は乗らない。 半年前のデータも今朝のデータも、AIは同じ自信で読み上げる。

これ、人間相手なら起きにくい。同僚に「キャッシュどう?」と聞いて「あ、それ先月見た数字だけど」と前置きが付く。人間は無意識にいつ時点の話かを添える。AIは添えない。聞かれたことに、手元にある材料で、即答する。材料が腐っていても。

怖いのは、嘘をついているわけじゃないこと。データは実在する。ただ古い。一番タチが悪いやつだ。

直し方は「謝らせる」じゃなく「先に言わせる」

最初は注意で直そうとした。プロンプトに「古いデータを使うな」と書く。効かない。AIは自分が古いデータを掴んでいることに気づいていないんだから、「使うな」と言われても判断できない。

発想を変えた。判断させる前に、手元のデータが何日前のものかを、機械的に先頭へ出させる。

会社のデータソースは複数ある。会議の文字起こし、メモ、タスク管理、クラウドの構成情報。それぞれ最終更新がバラバラだ。そこで、各ソースの「最終更新がいつか」をスクリプトで集計して、Claude が口を開く前に、必ずこのブロックを先頭に貼るようにした。

## データ鮮度
- 会議メモ 最終 sync: 2026-06-01 (0 日前)
- タスク管理 最終 sync: 2026-05-27 (4 日前)
- ⚠ クラウド構成 最終 commit: 2026-05-09 (22 日前)
- 経営ダッシュボード: リアルタイム取得

⚠ クラウド構成 が 22 日未更新 → 同期推奨

※ ソース名・日付はサンプルです。

これだけ。AIに新しい賢さを足したわけじゃない。「今から喋る材料は、いつの時点のものか」を、判断の前に強制的に自己申告させただけ。

効果は、思っていたのと違う方向から来た。

一番効いたのは「AIが」じゃなく「人間が」気づけること

鮮度ブロックを足して、AIの判断が劇的に賢くなったか。そこまでじゃない。 正直に言う。

劇的に変わったのは、読む側=人間(私)の挙動だった。

回答の冒頭に「クラウド構成 22 日未更新 ⚠」と出ていると、その下に続く構成まわりの話を、私が勝手に割り引いて読むようになった。「あ、これ3週間前の状態で喋ってるな。最新じゃないかも」と、無意識にブレーキがかかる。

逆に「会議メモ 0 日前」と出ていれば、安心して鵜呑みにできる。鮮度ブロックは、AIへのガードであると同時に、人間が"どこまで信じるか"のメーターになった。

判断の質って、結局「どの情報をどれだけ信じるか」の配分だ。全部を等しく信じると事故る。鮮度の表示は、その配分を毎回ゼロコストで教えてくれる。AIに賢くなってもらうより、人間が騙されなくなるほうが、たぶん速かった。

ついでに「鮮度情報そのものの鮮度」も見張る

ここで一段、罠がある。鮮度を集計するのにも時間がかかる。毎回の応答で全データソースを舐め直すと重い。だからキャッシュする。1時間に1回まとめて集計して、各役員はそのキャッシュを読むだけにした。軽い。

ところが今度は、キャッシュ自体が古くなる問題が出る。「鮮度は新しいですよ」と言っているそのメモが、実は半日前の話だった、なんてことが起きる。鮮度を測る物差しが錆びてる。メタな罠だ。

なので、ブロックの一番下にこう出すようにした。

⚠ 鮮度情報自体が 28.0 時間古いです。再計算してください。

キャッシュが一定時間(うちは25時間)を超えたら、「この鮮度表示、もう信じるな」と自分で白状する。鮮度を見張る仕組みの、その鮮度まで見張る。 ここまでやって、ようやく「いつの数字?」に毎回ちゃんと答えられる状態になった。

全体のフローはこうなった。

判断の前に、必ず鮮度が挟まる。順番が大事だ。回答の後ろに小さく注記するんじゃ意味がない。先頭で、判断より先に、目に入る位置に置く。

真似する時の最小形

大層なものは要らない。やることは3つだけ。

  1. データソースの最終更新を集計する。ファイルの更新日時でも、Git の最終コミットでも、APIの取得時刻でもいい。「いつ時点か」が分かればなんでもいい。
  2. AIに喋らせる前に、それを先頭へ貼らせる。判断の後ろじゃなく前。〜日前と、古いものには を付けて。
  3. 一定日数を超えたら警告に変える。何日でアウトかは扱うデータ次第(うちは7日で⚠)。リアルタイム取得できるものは「リアルタイム」と明記して区別する。

ポイントは、AIに鮮度を"判断"させないこと。「このデータ古いと思いますか?」とAIに聞いたら、また雰囲気で答える。そうじゃなく、日付の引き算という機械にできることは機械にやらせて、結果だけAIに持たせる。AIの仕事は判断、鮮度の計測は機械の仕事。混ぜない。

まとめ:日付は、判断の前に置く

AIに経営判断を任せると決めた瞬間から、一番怖いのは「間違った判断」じゃなかった。正しい判断軸で、古いデータを、自信満々に処理されることだった。

防ぎ方は、賢いプロンプトでも、強い言い聞かせでもなかった。「それ、いつの数字?」を、AIが口を開く前に、毎回先頭で自己申告させる。 たったそれだけで、AIは古さを隠せなくなり、人間は騙されにくくなった。

判断軸(#2)は「どう考えるか」を決める。鮮度ブロックは、その判断軸が何を材料にしているかに日付を打つ。考え方が正しくても、材料が腐っていたら結論は腐る。だから日付は、判断の前に置く。


先月の数字を今月の顔して喋るAIに、何度か頷きかけた自分に言いたい。まず聞け。「それ、いつの数字?」 ──その一言を、AIが喋り出す前に、仕組みのほうから言わせておけ。

(前回 #2: Claudeのペルソナは口調より「判断軸とタブー」で決まる)
(次回 #4 は、AIが書いたコードを別のAIに3段階でレビューさせる――"AIの仕事をAIに検品させる"話です → 【Claude Codeで会社を回す #4】Claudeが書いたコードを、別のClaudeに3段階レビューさせる


この記事について

arecore.net の中の人が運用する AI 役員チームの実践記録です。受託開発・SES・自社プロダクト開発をやっています。ご相談・フィードバックは arecore.net からどうぞ。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?