Copilot エージェント導入で、開発者の生産性は本当に上がったのか?
この記事は Wano Group Advent Calendar 2025 の 12 日目の記事です。
GitHub Copilot や AI エージェントを活用した開発が定着してきた 2025 年。体感としては「楽になった」と感じていても、実際の数値として生産性はどう変化したのでしょうか?
今回は、2024 年(AI 導入過渡期)と 2025 年(AI 本格活用期)の個人の実績データを比較・分析し、その効果を定量的に振り返ってみました。
⚡️ 要約
先に結論から述べると、コード行数ベースでの生産性は明確に向上していました。
- 時間あたりの生産性: 1 時間あたりの有効変更行数が 約 23% 向上(36.4 行 → 44.9 行)
- 総アウトプット: 稼働時間が 約 12% 減少 したにもかかわらず、変更行数は 約 9% 増加
- 開発スタイルの変化: PR のサイズ(中央値)が 約 4.4 倍 に巨大化。AI にある程度まとまった実装を任せるスタイルへの変化が見られます
📊 計測条件と定義
以下の条件でデータを抽出・集計しました。
-
対象期間:
- 2024 年: 1/1 〜 12/31 に作成され、マージされた PR
-
2025 年: 1/1 〜 11/26 に作成され、年末時点で「マージ済み」または「Open」の PR
- ※ 2025 年は進行中のため、作業実績として Open な PR も含めています。
-
対象 PR:
-
著者作成 PR:
authorが本人である PR -
Copilot 作成 PR:
authorが@copilotかつ、assigneeが本人である PR(著者が指示してタスクを与えた PR)
-
著者作成 PR:
- 除外対象: マージされずに Close された PR(ノイズとして除外)
- 評価指標: Additions と Deletions の合計を行数(変更規模)として扱います
📈 2024年 vs 2025年 実績比較
2025 年のデータ(マージ済み・Open・Copilot 作成の合算)を整理し、2024 年と比較しました。
| 指標 | 2024年 (実績) | 2025年 (実績) | 変化率 |
|---|---|---|---|
| 実稼働時間 | 1,072.5 時間 | 946.25 時間 | -11.8% |
| PR 総数 | 146 本 | 107 本 | -26.7% |
| 総変更行数 (Add+Del) | 39,032 行 | 42,447 行 | +8.8% |
| 生産性 (行数/時間) | 36.4 行/h | 44.9 行/h | +23.3% |
Note: 2024 年と2025年の稼働時間が少ない要因は、育児休業の取得によるものです。
データから読み取れること
稼働時間は 約 126 時間(約 15 営業日分)削減 されているにもかかわらず、生み出されたコードの総量は 約 3,400 行増加 しています。
結果として、時間あたりのコーディング効率(生産性)は 1.23 倍 に向上しました。
🔍 開発スタイルの変化:PR の巨大化
「PR の粒度」にも大きな変化が見られました。
| 指標 | 2024年 | 2025年 | 変化 |
|---|---|---|---|
| PR サイズ平均値 | 267 行 | 434 行 | +62.5% |
| PR サイズ中央値 | 37 行 | 162 行 | +338% (約 4.4 倍) |
2024 年は「こまめに小さな PR を出す」スタイル(中央値 37 行)でしたが、2025 年は「ある程度まとまった単位で PR を出す」スタイル(中央値 162 行)へ移行しています。
考察:
以前は自力でコーディングを進める中で、「気づけば巨大な差分になってしまい、後から手作業でブランチを切り分ける」という工程が発生していました。
現在は AI エージェントにタスクを依頼する段階で機能の区切り(Branching)が明確になるため、後処理の手間が減り、結果として「意味のあるまとまり(機能単位)」で PR を作成できるようになりました。
🤖 Copilot エージェントの直接的な貢献
2025 年の全変更行数(42,447 行)のうち、Copilot が直接の Author となっている PR の内訳は以下の通りです。
- Copilot PR 行数合計: 3,570 行
- 全体に占める割合: 約 8.4%
現時点では「AI が勝手にコードを書いてくれる」割合は全体の 1 割未満です。しかし、Open な PR(現在進行系)においては平均サイズが 500 行を超えています。
テストコードやボイラープレートの生成において、AI が「実装の下地」を作る役割を大きく果たしていることが推測されます。
✅ 心理的な変化と定性的な感想
数値には表れない、AI 同伴開発における「エンジニアの心理的・体感的な変化」についても触れておきます。
-
レビュー依頼前の負荷軽減
- 前述の通り、Agent Mode を使うことで機能ごとの切り目が明確になりました。自力実装時のように「作りすぎてから分割する」作業がなくなり、レビュー依頼に至るまでの心理的ハードルが下がりました
-
脳への負荷と「夕方のイライラ」
- AI に指示を出しながら自分でも作業することで、2 つほどのタスクを同時並行で進められます。しかし、タスク切り替え(Context Switch)のコストで脳への負担は増しており、夕方頃には脳が疲弊してイライラしやすくなる副作用も感じています
-
初動のスピードアップ
- 既存コードの修正範囲の調査などを AI とのダブルチェックで行えるため、実装に入るまでの迷いや調査時間が短縮されました
-
コードの定着率の低下
- ある程度規模が大きいプロジェクトだと、自分で一行ずつ書いていない分、コードの詳細が記憶に定着しにくい感覚があります
-
心理的安全性の向上
- 既存コードや修正内容の不明点を、気兼ねなく何度でも質問できるため、深い理解に至りやすくなりました
🏁 結論と今後の課題
結論
「コード行数ベースの生産性は上がった」と言えます。
短い稼働時間(育休取得含む)の中でより多くのコードを生み出しており、特に時間あたりの効率(+23%)は明確な改善を示しました。これは、AI への実装委譲による PR 粒度の適正化と、作業プロセスの効率化が寄与していると考えられます。
残された課題:質的な評価
今回の指標はあくまで「量(行数)」です。以下の点は今回のデータからは読み取れません。
- そのコードが生み出したビジネス価値
- 要件定義や設計など、非コード作業の比重の変化
- レビュー負荷や手戻りのコスト
2026 年に向けては、GitHub Issues のストーリーポイント消化数や、Issue から Merge までのリードタイムなど、「価値ベース」の指標も組み合わせて、AI 同伴開発の真価を評価していきたいと考えています。
📣 採用案内
Wano Group では、新しい開発スタイルを積極的に取り入れ、生産性と価値の最大化に挑むエンジニアを募集中です。
ご関心のある方は、ぜひ以下からご応募ください。