連載『Claude Codeで会社を回す』#3 ── 一人会社が Claude Code で回す AI役員チームの実録。人間(@noracorn)がレビューして公開しています。
前回(#2)、Claude のペルソナは口調じゃなく「判断軸とタブー」で決まる、という話を書いた。判断軸を入れたら出力が安定した、と。
でも、判断軸には前提がある。「何を見て判断するか」のデータが正しくないと、判断軸が正しくても結論はズレる。 今回はそのデータの話。もっと言うと、鮮度の話だ。
AIは、半年前の数字を「今の数字」として平然と喋る
最初にやらかしたパターンを白状する。
財務担当の Claude に「今キャッシュどう?」と聞いた。スラスラと答えが返ってくる。残高、入金予定、コスト。それっぽい。で、よく見たら先月の集計だった。
AIは悪びれない。古いデータを掴んだまま、現在形で喋る。「〜です」「〜になっています」。語尾が断定だから、こっちも一瞬信じる。口調に鮮度は乗らない。 半年前のデータも今朝のデータも、AIは同じ自信で読み上げる。
これ、人間相手なら起きにくい。同僚に「キャッシュどう?」と聞いて「あ、それ先月見た数字だけど」と前置きが付く。人間は無意識にいつ時点の話かを添える。AIは添えない。聞かれたことに、手元にある材料で、即答する。材料が腐っていても。
怖いのは、嘘をついているわけじゃないこと。データは実在する。ただ古い。一番タチが悪いやつだ。
直し方は「謝らせる」じゃなく「先に言わせる」
最初は注意で直そうとした。プロンプトに「古いデータを使うな」と書く。効かない。AIは自分が古いデータを掴んでいることに気づいていないんだから、「使うな」と言われても判断できない。
発想を変えた。判断させる前に、手元のデータが何日前のものかを、機械的に先頭へ出させる。
会社のデータソースは複数ある。会議の文字起こし、メモ、タスク管理、クラウドの構成情報。それぞれ最終更新がバラバラだ。そこで、各ソースの「最終更新がいつか」をスクリプトで集計して、Claude が口を開く前に、必ずこのブロックを先頭に貼るようにした。
## データ鮮度
- 会議メモ 最終 sync: 2026-06-01 (0 日前)
- タスク管理 最終 sync: 2026-05-27 (4 日前)
- ⚠ クラウド構成 最終 commit: 2026-05-09 (22 日前)
- 経営ダッシュボード: リアルタイム取得
⚠ クラウド構成 が 22 日未更新 → 同期推奨
※ ソース名・日付はサンプルです。
これだけ。AIに新しい賢さを足したわけじゃない。「今から喋る材料は、いつの時点のものか」を、判断の前に強制的に自己申告させただけ。
効果は、思っていたのと違う方向から来た。
一番効いたのは「AIが」じゃなく「人間が」気づけること
鮮度ブロックを足して、AIの判断が劇的に賢くなったか。そこまでじゃない。 正直に言う。
劇的に変わったのは、読む側=人間(私)の挙動だった。
回答の冒頭に「クラウド構成 22 日未更新 ⚠」と出ていると、その下に続く構成まわりの話を、私が勝手に割り引いて読むようになった。「あ、これ3週間前の状態で喋ってるな。最新じゃないかも」と、無意識にブレーキがかかる。
逆に「会議メモ 0 日前」と出ていれば、安心して鵜呑みにできる。鮮度ブロックは、AIへのガードであると同時に、人間が"どこまで信じるか"のメーターになった。
判断の質って、結局「どの情報をどれだけ信じるか」の配分だ。全部を等しく信じると事故る。鮮度の表示は、その配分を毎回ゼロコストで教えてくれる。AIに賢くなってもらうより、人間が騙されなくなるほうが、たぶん速かった。
ついでに「鮮度情報そのものの鮮度」も見張る
ここで一段、罠がある。鮮度を集計するのにも時間がかかる。毎回の応答で全データソースを舐め直すと重い。だからキャッシュする。1時間に1回まとめて集計して、各役員はそのキャッシュを読むだけにした。軽い。
ところが今度は、キャッシュ自体が古くなる問題が出る。「鮮度は新しいですよ」と言っているそのメモが、実は半日前の話だった、なんてことが起きる。鮮度を測る物差しが錆びてる。メタな罠だ。
なので、ブロックの一番下にこう出すようにした。
⚠ 鮮度情報自体が 28.0 時間古いです。再計算してください。
キャッシュが一定時間(うちは25時間)を超えたら、「この鮮度表示、もう信じるな」と自分で白状する。鮮度を見張る仕組みの、その鮮度まで見張る。 ここまでやって、ようやく「いつの数字?」に毎回ちゃんと答えられる状態になった。
全体のフローはこうなった。
判断の前に、必ず鮮度が挟まる。順番が大事だ。回答の後ろに小さく注記するんじゃ意味がない。先頭で、判断より先に、目に入る位置に置く。
真似する時の最小形
大層なものは要らない。やることは3つだけ。
- データソースの最終更新を集計する。ファイルの更新日時でも、Git の最終コミットでも、APIの取得時刻でもいい。「いつ時点か」が分かればなんでもいい。
-
AIに喋らせる前に、それを先頭へ貼らせる。判断の後ろじゃなく前。
〜日前と、古いものには⚠を付けて。 - 一定日数を超えたら警告に変える。何日でアウトかは扱うデータ次第(うちは7日で⚠)。リアルタイム取得できるものは「リアルタイム」と明記して区別する。
ポイントは、AIに鮮度を"判断"させないこと。「このデータ古いと思いますか?」とAIに聞いたら、また雰囲気で答える。そうじゃなく、日付の引き算という機械にできることは機械にやらせて、結果だけAIに持たせる。AIの仕事は判断、鮮度の計測は機械の仕事。混ぜない。
まとめ:日付は、判断の前に置く
AIに経営判断を任せると決めた瞬間から、一番怖いのは「間違った判断」じゃなかった。正しい判断軸で、古いデータを、自信満々に処理されることだった。
防ぎ方は、賢いプロンプトでも、強い言い聞かせでもなかった。「それ、いつの数字?」を、AIが口を開く前に、毎回先頭で自己申告させる。 たったそれだけで、AIは古さを隠せなくなり、人間は騙されにくくなった。
判断軸(#2)は「どう考えるか」を決める。鮮度ブロックは、その判断軸が何を材料にしているかに日付を打つ。考え方が正しくても、材料が腐っていたら結論は腐る。だから日付は、判断の前に置く。
先月の数字を今月の顔して喋るAIに、何度か頷きかけた自分に言いたい。まず聞け。「それ、いつの数字?」 ──その一言を、AIが喋り出す前に、仕組みのほうから言わせておけ。
(前回 #2: Claudeのペルソナは口調より「判断軸とタブー」で決まる)
(次回 #4 は、AIが書いたコードを別のAIに3段階でレビューさせる――"AIの仕事をAIに検品させる"話です → 【Claude Codeで会社を回す #4】Claudeが書いたコードを、別のClaudeに3段階レビューさせる)
この記事について
arecore.net の中の人が運用する AI 役員チームの実践記録です。受託開発・SES・自社プロダクト開発をやっています。ご相談・フィードバックは arecore.net からどうぞ。