はじめに
Devinの概要
Cognition AI 社が 2025 年に正式リリースした Devin は、仕様理解からコード生成・テスト・デプロイ・PR 作成までを自律的にこなす自律型の “AI ソフトウェアエンジニア” です。
従来の補完型ツールが IDE 内の一挙手一投足を支援するのに対し、Devin はクラウド上の安全なワークスペースでターミナル/ブラウザ/エディタを操作しながらタスクを丸ごと遂行します。
AI開発アシスタントとAI開発エージェントの違い
ツール | 種別 | 実装形態 / 実行環境 | コード変更粒度 | テスト・ビルド実行 | PR 自動作成 | 価格目安 (個人/席) |
---|---|---|---|---|---|---|
GitHub Copilot | AI開発アシスタント | IDE プラグイン (VS Code 等) | 行〜関数レベルの補完 | × | × | $10/月 |
RooCode & Cline | アシスタント(自律操作拡張) | VS Code 拡張・CLI | ファイル〜プロジェクト | ○ (CLI 実行可) | × | LLM API 利用料 |
Cursor | アシスタント(Agentモード) | 独自 IDE / VS Codeベース | ファイル〜プロジェクト | ○ (統合ターミナル) | ○ | Pro $20/月, Business $40/月 |
Devin Core | AI開発エージェント | クラウド仮想 IDE(ブラウザ) | 機能〜プロジェクト丸ごと | ◎ (自律実行) | ◎ | 従量課金(最低 $20、$2.25/ACU ) |
Devin Team | AI開発エージェント(API・多セッション) | 同上 | 同上 | ◎ | ◎ | $500/月(250 ACU込み, $2.00/ACU) |
Copilot は “ペアプロの相棒”、Devin は “ジュニアエンジニア” に近い立ち位置というわけですね。
Devin Coreとは
2025年4月 にGAされたプランで、基本の機能(エージェントIDE, Devin Search, Devin Wiki, Knowledge。後述します)が使用可能です。
月額の課金は無く、最初に10ACUs( = $20)
購入し、以降従量課金となります。
エディタ、Slackなどからの指示やPull Requestへの自動反応が無いことがTeamプランとの違いです。
Devin Teamとは
基本の機能が使用可能な他、DevinのAPIアクセス権が付与され、外部ツール連携やカスタマイズが容易となります。
専用のSlackチャンネルによって開発者からのオンボーディング支援を受けることや、最新機能の優先アクセスが可能なプランです。
主に、会社としてDevinくんを導入する場合はこのプランかEnterpriseプランとなると思います。
Devinとの付き合い方について
Devinの得意なこと
- 小〜中規模のバグフィックス・機能追加を並列に処理
- テストコードの自動生成とカバレッジ向上
- 既存コードのターゲットリファクタリング・モダナイゼーション
- コードリーディング
小〜中規模のバグフィックス・機能追加を並列に処理
Devinはセッション毎に環境を持つ為、同時に複数の指示を実行しても競合は起こりません。
また、Devin2.0より、Interactive Planning によるタスク分割が俊敏となりました。(後述します)
https://docs.devin.ai/work-with-devin/interactive-planning
30分ほどでAIが実行可能な規模のタスクに優れています。
あくまで体感なので正確な数値ではないですが、およそ±150 〜 250 行の変更や、3 ~ 5ファイルの変更を目安にすると良いのではないかと思っています。
2025年2月 に Sonnet 3.7 を内部的に使用するよう変更され、
テストコードの自動生成とカバレッジ向上
公式ドキュメントから推奨されているユースケースの一つです。
Devinは複雑なコンテキストの読み取り、長期保持は構造上不可能であるため、「独立していて、ゴールが明確なタスク」に特に能力を発揮します。
When deciding if a task suits Devin, the first question to ask yourself is: Could a junior engineer figure this out given enough time and context?
十分な時間と状況があれば、ジュニア エンジニアでも理解が可能な作業スコープを与えるべき
また、CI 相当のテスト実行・ビルド確認をその場で済ませることが可能であるため、既存のコードに対するテストコードの生成や、カバレッジの低いソースコードを自ら見つけての対応といったタスクが得意であると言えます。
既存コードのターゲットリファクタリング・モダナイゼーション
- テストカバレッジの作成と拡張
- コードのリファクタリングと最適化
- APIエンドポイントの開発と変更
- パフォーマンスの改善
- コードレビューと品質保証
- Devin API による自動テストワークフロー
といったタスクが、公式ドキュメントにおいて得意なものとして挙げられています。
前述したものと同様、「独立していて、ゴールが明確なタスク」です。
コードリーディング
Cursor等とは違い、リポジトリを初回クローンしたとき、Devinはアーキテクチャ図、ドキュメント、ソースへのリンクといったWikiを生成します。(後述するDevin Wikiです。)
LLM の長大コンテキストに随時注入するため、ソースコードについての質問に非常に高精度で、高速に回答することが可能です。
仕様質問やアーキテクチャについての質問はDevinが特に優れているタスクの一つと言えます。
動的に仕様を解析し回答を実施する様子が上セクションでも確認可能です。
Devinの苦手なこと、できないこと
- 大規模リプレイスなど長期タスクの一括丸投げ
- 「当然やらないはず」のセキュリティリスクへの配慮
- Figmaデザインの実装等の、視覚的な作業
- 他のSessionについての質問・消費したトークン等のメタ的質問
大規模リプレイスなど長期タスクの一括丸投げ
Devinは事前にタスクを分割するのですが、手順ツリーが深く分岐することで収束しなくなります。
セッションが 10 ACU 以上・数時間を超えることで、コンテキストウィンドウが足りなくなり、当初の目的や予定していたタスク順序が混線してしまうなど。
一般的なAIと同様の弱点によるものです。
噂されているMulti Devin機能ではこの弱点をなるべく補おうとしているようですが、何かしら大きなブレイクスルーが起きない限り根本的な弱点は変わらないでしょう。
「当然やらないはず」のセキュリティリスクへの配慮
与えられてない遵守事項については暗黙の了解はしてくれず、暴走する事例を他社様の記事等で幾つか観測しています。
秘密鍵を漏らされそうになった、mainにブランチをマージしようとしたなど。。。
行動指針ではなく、"プロトコル"として、遵守事項をKnowledge等に登録しておく必要があります。
Figmaデザインの実装等の、視覚的な作業
Devモード等を利用している場合は話は別ですが、視覚的な要素を再現する、といったタスクはDevinは苦手です。
アイパスを渡してあげることで、Figmaへのログイン自体はDevinは可能なため、今後の可能性に期待です。
他のSessionについての質問・消費したトークン等のメタ的質問
Devinは新規のセッション毎にインスタンスが立ち上がります。他のセッションの内容については記憶を持たないため、「以前やってもらった」といった文脈を不得意とします。
ドキュメントを渡す、PRを見せる、Knowledgeに登録するといった対策を実施してあげてください
また、消費したトークンを教えてもらうことも不可能です。(2025年4月時点)
その日の終わりに日報を書いてもらうためにさまざまな施策をとってみましたが、いずれも上手くいきませんでした。
(Devinの日報用のリポジトリを作り、各セッションで明示的に日報をコミットするよう指示を与えることで上手くいくと思われますが、組織での運用では現実的ではないかと思います。良い運用をご存知の方はコメントいただけると幸いです。)
Devinの主な機能
エージェントIDE
Devinはセッションが開始された時、インタラクティブなIDEを模したVSCode UI上で稼働します。
Devin用のIDEとして立ち上がっていますが、Devinの作業を止めて競合のリスクを無くしたうえで、当該画面上でユーザーが変更を実施出来る、ブラウザ上のIDEして使用することも可能です。
GitHub CodeSpacesのようなものをイメージすると良いのかもしれません。
リリースノートに添付されている動画では、ターミナルで独自のコマンドを実行したり、エディタでDevinのコードを直接修正したり、あるいはQuick Agent (Cmd+I) を使ってDevinに部分的な修正を指示したりするなど、人間が必要に応じてタスクのコントロールを取り戻し、Devinの作業に介入できることが強調されています。
Devin API
REST APIを使用してプログラムでDevinセッションを作成および管理することが可能です。
- セッションに関するAPI
- セッションを作成する
タスクの説明とオプションのパラメータを指定して新しいDevinセッションを開始する - セッションの詳細を取得する
既存のセッションのステータスと出力に関する情報を取得する - メッセージを送信
Devinにメッセージを送信してアクティブなセッションと対話する - ファイルをアップロードする
セッション中に Devin が作業するためのファイルをアップロードします - セッション一覧
組織内の現在のすべての Devin セッションを一覧表示します - セッションタグの更新
Devinセッションに関連付けられたタグを更新する
- セッションを作成する
- シークレットに関するAPI
- 一覧取得
組織内のすべてのシークレットのメタデータを表示する - シークレットを削除
組織からシークレットを完全に削除する
- 一覧取得
Devin API を使用して GitHub リポジトリを分析する方法や、QAテストを自動的に実行する方法などが示されています。
(QAテストの自動実行についてのリポジトリ)
https://github.com/CognitionAI/qa-devin
Knowledge
Devinがあらゆるセッションで参照できる指示やアドバイスの集合体です。
コードコンフォーマンスの実践、デプロイワークフロー、PRの命名規則、テストワークフロー、独自ツールとの連携方法などを事前に登録しておくことで、Devinはその内容を自動的に参照し、業務を効率的に遂行します。
System Knowledge(Built-in knowledge, Repo Indexes)と、その他のKnowledge(ユーザーが新規登録、編集出来るもの。また、作業の中で新規に学習したことを、ユーザーが希望すればKnowledgeに自動登録するもの)に分かれます。
情報が特定のコンテキストにのみ関連する場合は、特定のリポジトリにピン留めすることもできます。
Devin Search
2025年4月 に追加されたコードベースへの特化検索エンジンです。
任意のリポジトリを対象に “認証バックエンドのエンドポイントはどこ?” “この機能を導入したコミットを教えて” といった自然言語クエリで調査できる。検索結果には該当ファイル・行番号・コミットハッシュが引用付きで提示され、そのまま Cmd + Enter で Devin へのタスク依頼に変換可能。深い探索が必要な場合は Deep Mode で検索範囲を自動で拡張可能です。
私はショートカットを設定し、ブラウザのURLバーからDevin Searchを起動出来るようにしています。
非常に強力なケースが多いように感じています。
Devin Wiki
自動生成されるリポジトリ概観ドキュメントです。
リポジトリを登録すると数時間おきにインデックスが更新され、アーキテクチャ図やクラス図、主要コンポーネントごとの概要 / 依存関係がソースコードに直リンクされた状態で生成されます。
それらは大まかな文脈毎にまとめられており、「商品の注文フロー」といったコンテキストでまとめられています。
Devin SearchはDevin Wikiの内容をもとに回答を行います。
Interactive Planning
着手前に “設計レビュー” を行うステップです。
セッション開始直後、Devin はコードベースを高速サーベイし、変更対象ファイル・影響範囲・作業手順を箇条書きのプランとして提案。
ユーザーはチェックリスト感覚で編集・確定できるため、誤ったファイルの改変や過剰実装を防止できます。
実作業を行う前にユーザーと認識合わせする・広範なコンテキストや詳細なスコープを必要とする複雑なタスクを細かい粒度に分解するといった目的で行われます。
Playbook
再利用可能な “プロンプトテンプレート” ライブラリを登録可能です。
よくあるタスク(テスト足りない箇所の網羅、翻訳ファイル同期など)を Markdown 形式で記述し、チーム/コミュニティライブラリに保存するとワンクリックで添付可能となります。
Slack や IDE 拡張から !macro で呼び出すこともできる。実行ログをタイムラインで巻き戻して改良→再保存するワークフローもサポートします。
同じサードパーティ製ライブラリをアプリケーションの異なる部分に統合する複数の異なるDevinセッションが必要な場合などに役立ちます。
JavaScriptで実装されたコードをTypeScriptへ移行する際の詳細な指示内容についてまとめられているPlaybooksがサンプルとして提供されています。
(具体的な内容としては、「interfaceではなくtypeを使用する」、「人間にアドバイスを求める必要が生じた場合、そのやり取りをxxx.mdというファイル名で記録すること」といった作業の詳細な手順から、ブランチ名等があります。)
Devin's Workspace
毎セッション “スナップショット” から起動する専用 VMです。
事前にセットアップした複数リポジトリ・依存パッケージ・シークレットを含む仮想マシン状態を保存し、セッション開始時に自動復元。これにより環境構築時間ゼロでタスクを実行可能です。
高度な利用者は目的別にスナップショットを分け、マイグレーションや検証を並列化可能。
作業コンテナを保持しておいているようなものと理解しています。
Devin VSCode拡張機能
ローカル IDE から Devin セッション管理が可能です。
Marketplace 配布の拡張をインストールすると、VS Code 内パネルから
新規/既存セッションの一覧とステータス確認
チャット/コマンド送信
Devin が生成した diff・ログのインラインレビュー
が可能となります。
ブラウザ版 IDE に切り替えることなくローカル環境で高速フィードバックループを実現出来ます。
コード生成・修正タスクの効率化ポイント
-
タスクを“ジュニアクラス規模”に分割する
300 行未満・1〜3 ファイル程度 にそもそもタスクを切り出して渡してあげると最大効率で動く傾向にある。 -
明確なゴールと検証方法を提示
例: 「ユニットテストが全て通過」「Lint エラー 0 件」など 明確で判定しやすい条件 を指定する。 -
開発ドキュメント、Knowledge × Playbook を活用し“迷わない道”を敷く
- 規約やドメイン知識 ⇒ 開発ドキュメント、Knowledge
- 定型修正手順 ⇒ Playbook
先に登録しておけば、毎回のプロンプトが劇的に短縮。
-
Interactive Planning で初手プランをレビュー
Devin が提示する作業計画を確認・修正してから実行し、無駄な編集を防止。 -
Workspace スナップショットで“環境構築ゼロ秒”
依存解決済み VM を保存し、セッション起動ごとに即復元。 -
Devin Search / Wiki で目的ファイルを即特定
パスを添えて指示 → 探索コスト減少。深掘り時は Deep Mode を使用。 -
短いフィードバックループを維持
CI と人間レビューで早期に方向修正し、ACU 消費を最小化。
導入効果を最大化するベストプラクティス
フェーズ | 実践ポイント | 効果 |
---|---|---|
起動前 | 朝イチで複数セッションを並列投入し、小粒タスクを設定 | レビュー待ち時間を圧縮 |
オンボーディング | Knowledge を少量から開始し、Playbook と併用して拡充 | 早期に成果を体感、過学習を防止 |
タスク実行中 | チェックポイントを設置し、Prompt 改善提案を活用 | 迷走・ループを抑制 |
統合 | Jira, Linear などのチケトラと連携し、割り当てテンプレを標準化 | |
評価 |
app.devin.ai/metrics で PR 成果と時間を可視化 |
ROI を定量化し改善サイクルを回す |
スケール | “人間 80% / Devin 20%” → “人間 20% / Devin 80%” へ段階移行 | リスクを抑えつつ自動化比率を拡大 |