AIエージェント導入の判断基準──任せていい仕事、まだ任せない仕事第9回

Posted at 2026-06-17

このシリーズでは、AIエージェントを開発工程に入れる方法を書いてきました。

最後に、導入の判断基準をまとめます。

どの作業から始めるべきか。
どこまで任せてよいか。
まだ任せない方がよい作業は何か。
チームで使うなら、何を先に整えるべきか。

AIエージェントは、使うだけなら簡単です。

難しいのは、日常の仕事に入れることです。

最初に任せるべき仕事

最初から重要な本番作業を任せる必要はありません。

最初に向いているのは、失敗しても戻しやすく、成果物を人間が確認しやすい仕事です。

たとえば、

既存リポジトリの read-only 調査
入口ファイルの整理
既存テストの調査
docs の要約
issue の整理
PR説明文の下書き
review checklist の作成
failing test の候補作成
エラーログの時系列整理
バグ報告の整形

これらは、agent が間違えても人間が直しやすい。

しかも、すぐ役に立ちます。

最初から「機能を丸ごと作って」ではなく、「人間が判断しやすい材料を作って」から始める。

これが一番安定します。

4段階で考える

任せ方は、4段階に分けます。

Level 1: 読ませる
Level 2: 下書きさせる
Level 3: 限定して変更させる
Level 4: 承認付きで外部状態を変える

Level 1 は read-only です。

調査、要約、入口探し、ログ整理。

Level 2 は draft です。

PRコメント案、仕様書案、修正計画、runbook 案。

Level 3 は limited write です。

指定ファイルだけ変更、テストだけ追加、docs だけ更新。

Level 4 は approval required です。

外部サービスへの投稿、ticket 更新、PR作成、staging 操作。

最初は Level 1 と Level 2 だけで十分です。

慣れてから Level 3。

Level 4 は最後です。

任せてよい作業の条件

AIエージェントに任せやすい作業には、条件があります。

- 目的が明確
- 変更範囲が小さい
- 既存パターンがある
- テストで確認できる
- rollback しやすい
- review しやすい
- secret / PII を扱わない
- 本番状態を変えない

この条件に多く当てはまるほど、任せやすいです。

例：

文言修正
docs 更新
小さなUI修正
テスト追加
既存パターンに沿ったAPI修正
lint / type error の局所修正
既存ログの整理

逆に、条件から外れるほど慎重にします。

まだ任せない方がいい作業

次の作業は、最初から任せない方がいいです。

production deploy
production DB write
user data delete
billing 変更
権限変更
認証設計の大きな変更
暗号化、鍵管理、secret rotation
legal / compliance 判断
大きなDB migration
仕様が固まっていない大規模改修

これらは、agent が役に立たないという意味ではありません。

直接実行させない方がいい、という意味です。

任せるなら、材料作りにします。

deploy checklist を作る。
migration risk を整理する。
権限変更の影響範囲を洗い出す。
仕様の未決定点を列挙する。
review 観点を作る。
rollback plan を作る。

最後の判断と実行は、人間か既存の承認フローに残します。

導入は「便利そうな作業」から始めない

AIエージェント導入で失敗しやすいのは、便利そうなところから始めることです。

大きな機能を丸ごと作らせよう。
溜まったissueを全部処理させよう。
テスト不足の箇所を一気に直させよう。

気持ちは分かります。

でも、最初にやるには大きすぎます。

導入初期に見るべきなのは、便利さより管理しやすさです。

小さい
戻せる
見られる
測れる
繰り返せる

この5つを満たす作業から始めます。

最初の2週間でやること

チームで始めるなら、最初の2週間はこれで十分です。

1. AGENTS.mdを作る

最低限でいいです。

## Commands

- test:
- typecheck:
- lint:

## Boundaries

- secret を読まない
- production DB に触らない
- package追加は確認
- migration は確認

## Workflow

- 実装前にPlanを出す
- Bug fix 前に再現条件を出す
- 修正後に関連テストを実行する

2. read-only調査から始める

最初のタスクは、実装ではなく調査にします。

この機能の入口と既存テストを調べてください。
まだ変更しないでください。

3. 小さなテスト追加を任せる

次に、テストだけ追加します。

このバグを再現する failing test だけ追加してください。
実装は変更しないでください。

4. 小さな修正を任せる

対象ファイルを限定します。

この2ファイルだけ変更してください。
refactor はしないでください。

5. review checklistを作る

毎回見るものを固定します。

- 変更範囲は広すぎないか
- テストを消していないか
- 権限、DB、課金に触っていないか
- 既存パターンに沿っているか

これで十分に始められます。

成功指標を決める

導入の効果は、「AIを何回使ったか」では見ません。

見るべきなのは、仕事が安定したかです。

たとえば、

調査時間が短くなったか
review の入口が分かりやすくなったか
failing test が増えたか
同じ指摘が減ったか
PRの変更範囲が小さくなったか
AGENTS.md / checklist が育っているか
incident runbook が増えているか
人間が判断すべき点が明確になったか

速さだけを見ない方がいいです。

速く雑になるなら、導入としては失敗です。

速く、見やすく、戻しやすくなる。

ここを見ます。

コストを見る

AIエージェントにはコストがあります。

利用料金だけではありません。

review コスト
失敗時の戻しコスト
context を整えるコスト
tool 権限管理のコスト
テスト整備のコスト
team rule を保守するコスト

これを見ないと、「生成は速いが後処理が重い」状態になります。

導入初期は、次を記録します。

Task:
Agent used:
Human time saved:
Human review time:
Tests added:
Rollback needed:
What to improve next:

ざっくりでいいです。

記録があると、どの作業に向いているか見えてきます。

人間が持つべき仕事

AIエージェントを入れても、人間の仕事は残ります。

むしろ、はっきりします。

人間が持つべきもの：

目的
優先順位
許容リスク
ユーザー体験の判断
仕様の決定
本番反映の承認
セキュリティと権限の線引き
やらない判断

agent に向いているもの：

調査
下書き
再現
小さな実装
テスト追加
差分整理
checklist 作成
runbook 更新案

この分担ができると、agent はかなり強い味方になります。

逆に、人間の判断まで曖昧なまま agent に投げると、結果も曖昧になります。

事故時の戻し方を決める

導入前に、事故時の戻し方も決めます。

## Rollback Policy

- agent の変更は必ず diff で review する。
- 大きな変更は1PRにまとめない。
- production 操作は agent に直接させない。
- 外部tool使用はログを残す。
- 問題が出たら、変更を revert する前に原因を記録する。
- 再発防止は AGENTS.md / checklist / test に戻す。

事故をゼロにすることはできません。

でも、戻しやすくすることはできます。

戻しやすい作業から任せる。

これが導入の基本です。

よくある失敗

よくある失敗を挙げます。

1. いきなり大きな仕事を任せる

最初から大規模改修を任せると、review が詰まります。

小さく始めます。

2. AGENTS.mdがない

毎回同じ注意をチャットで書くことになります。

最低限のルールだけでも置きます。

3. reviewしない

AIが書いたから速い、で merge すると危ないです。

diff review、test、境界確認を入れます。

4. tool権限を広げすぎる

read-only と write を分けないと、外部状態が変わります。

最初は read-only。

5. 成功を速度だけで見る

生成速度だけを見ると、レビュー負債に気づきません。

見やすさ、戻しやすさ、再発防止まで見ます。

導入判断表

最後に、任せ方の判断表です。

作業	任せ方
既存コード調査	任せてよい。read-only
docs 要約	任せてよい。確認は必要
issue 整理	任せてよい。外部更新は draft
failing test 作成	任せてよい。review 必須
小さな bug fix	限定して任せる
UI小修正	限定して任せる。画面review必須
大規模refactor	分割して一部だけ
DB migration	調査と案まで
認証・権限変更	調査とreview観点まで
production deploy	任せない
user data delete	任せない
billing変更	任せない
PR merge	人間承認

まとめ

AIエージェント導入は、モデル選びだけでは決まりません。

どの仕事から始めるか。
どこまで任せるか。
どこで止めるか。
どう review するか。
何を次回に戻すか。

ここで決まります。

最初は read-only と draft から始める。
小さな変更だけ任せる。
review と test を通す。
外部toolは権限を分ける。
失敗したらルール、checklist、test、runbook に戻す。

AIエージェントは、全部を任せる相手ではありません。

人間が判断しやすい材料を作り、小さな作業を進め、学びを次回へ返す作業者です。

この距離感で使うと、開発の流れはかなり変わります。

速くなるだけではありません。

調査、実装、review、再発防止が、少しずつ同じ流れに乗っていきます。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

AIエージェント導入の判断基準──任せていい仕事、まだ任せない仕事 第9回