はじめに
この記事では、GitHub Copilot Pro に搭載されている "Copilot Coding Agent" を実際に使ってみた感想や評価をまとめています。特に、「コーディングエージェントとして本当に使えるのか?」「費用対効果はどうか?」「実装の精度や再現性はどうなのか?」という点に注目しました。
読者の皆さんには、Copilot の導入を検討している中級以上のエンジニアや、AIエージェントの開発活用に関心がある方を想定しています。
評価の概要
- GitHub Copilot Pro:月10ドル(30日無料トライアルあり)
- 使用機能:Copilot Coding Agent(Issue/PullRequest ベースでの自動修正)
- 主な評価観点:使い方、費用、動作精度、セッション単位の実用性、再現性
Copilot Coding Agent の使い方
セットアップ手順
- GitHub Copilot Pro に契約(30日トライアルあり)
- GitHub リポジトリの Issue に Copilot をアサインすることで自動的に動作を開始します
- Pull Request を自動で作成し、修正提案後にレビュー依頼まで進みます
- コメントで再実行も可能です(1コメントが1セッションとなります)
機能・仕様・コスト一覧
項目 | 内容 |
---|---|
プレミアムリクエスト上限 | 月300回まで |
セッション単位 | Pull Request を単位とし、1コメント = 1セッション |
旧仕様(〜7月10日) | 1セッションあたり50〜150回のリクエスト消費 |
新仕様(7月10日〜) | 1セッションあたり1回に固定化(コスト大幅削減) |
1セッションの実行時間 | 約25分で自動終了 |
Actionsによる追加コスト | 約 $2.22(今回の使用例) |
セッションログの活用
Issue や Pull Request に、Copilot セッションのリンクが表示されます。セッション内容を見ることで、エージェントの思考過程や処理ステップを確認することができ、プロンプトの修正にも活用できます。
lintエラー修正を任せたら数が多くてlintルール自体を変更して無視する様にし始めたのがセッションの思考過程に出ていたのため、プロンプトに「lintルールの変更を禁止」を追加して修正を進めることができました。
実施したタスクと評価結果
以下のようなタスクを Copilot Coding Agent に実行させ、その成果を評価しました。
タスク内容 | 結果・備考 | セッション数 | リンク |
---|---|---|---|
README.md の作成 | 内容は非常に丁寧で完成度が高い | 19回 | Issue #19, PR #20, Session |
テストの自動化 | モックの要否で迷走。最終的にMockベースに修正 | 約105回(試行錯誤含む) | Issue #17, PR #18, Session |
Lint対応と整形 | ruffでの静的解析。最初は3,892件のエラーから最終的にゼロへ | 10回 | Issue #22, PR #23, Session |
Lintエラー削減の進捗グラフ
最初〜4セッション目: pyproject.tomlのruffの定義にlintエラー無視を追加してきたので、5セッションでruffの定義を戻して編集禁止に
6~最後:全部修正してと言っても24分程度で終わってしまうので、地道に再依頼を繰り返し、全lyntエラーの撲滅ができた
まとめ・所感
GitHub Copilot Coding Agent を使ってみて、以下のような所感を持ちました:
- PullRequest 単位での修正は、実際の開発フローと非常に親和性が高いです
- セッションが完結型で追いやすく、トラブル時のログ追跡も容易です
- コストも月額10ドル+α程度で抑えられ、費用対効果が高いと感じました
- セッションログから AI の思考プロセスが見えるのは学習にも大いに役立ちます
今後の展望
- 自作coding agentへの使い勝手のフィードバック
- copilot coding agentで自作のcoding agentの性能アップ開発