はじめに
株式会社よりそう システム部の社内イベント用の発表資料です。
Devin とは
- 一言で言うと AI エンジニア
- Slack や GitHub 上で会話しそのまま PR 作成までやってくれる
OpenHands とは
- 一言で言うと Devin の OSS 版
- 元々は OpenDevin という名前だった
Devin でできること
- Slack や GitHub 上で会話してタスクの指示ができる
- 会話=スレッド単位でコンテナを持ち、ターミナル、ブラウザ、エディタ、オーケストレーションを使い自律的にタスクを実行できる
- GitHub PR を作ることができる
- 会話の中からそのプロジェクトのタスク遂行に必要と判断した知識を PlayBook に記録して擬似的に学習していく
demo
OpenHands でできること
Slack や GitHub 上で会話してタスクの指示ができる- 会話=スレッド単位でコンテナを持ち、ターミナル、ブラウザ、エディタ、オーケストレーションを使い自律的にタスクを実行できる
- GitHub PR を作ることができる
会話の中からそのプロジェクトのタスク遂行に必要と判断した知識を PlayBook に記録して擬似的に学習していく
demo
その他の違い
特徴 | Devin | OpenHands |
---|---|---|
モデル | 独自モデル | 好きなモデルのAPIを使用可能 |
課金方式 | 固定課金 + 従量課金 | APIごとの従量課金 |
ホスティング | マネージド | セルフホスティング or ローカル |
それぞれを使ってみた感想
Devin
- Slack でタスクを依頼して PR を出してくれるのは衝撃的な体験だった。
- 新規開発系のタスクには強いが、既存のプロジェクトの修正タスクは簡単なものでも 20 回以上コメントをやりとりの末上手くいかない、のようなことがざらにあった。Playbook の整理が重要そう。
- 個人開発にはちょっt高い😢
OpenHands
- 思っていたよりもセットアップが楽だった。(2コマンドのみ。3分くらいで試せる。)
- モデルを自分で選べるのは良い。
- claude-3.5-sonnet の API はエラーでよく止まる。リトライなどができないので使いづらい。
- 代わりに使った DeepSeek が安くてコードもまあまあだった。
- PlayBook はコードに含めることで代用出来るかも。
両方を使ってみての感想
- 開発に必要なツールのセットを複数個簡単に用意できるのがすごい
- 見えた未来
- 開発の水平スケール = 一人の人が何人分も働くことができる
- 複数タブで OpenHands を開いて並行で指示を出す
- タスクが完了したタブから次の指示を出す
- 以下ループ
- 要件定義がボトルネックになる
- エンジニアも要件定義をする必要が出てくる
- 開発の水平スケール = 一人の人が何人分も働くことができる
最後に
- 重い腰を上げてみて OpenHands を触ってみたが想像以上に簡単に使うことができた
- みんなも是非今すぐにやってみてください