2
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

AIエージェント】Claude Code vs Antigravity CLI!一晩で200ドル溶かさないための「自律ループ制御」超入門(第1回)

2
Posted at

はじめに

今回は僕のメンターからのおすすめの本があるということでその紹介です
Claude Code Loop Engineering: Build Self-Correcting Agentic Loops That Ship Trusted Code, Not a $200 Overnight Bill (English Edition)

この本ではclaude code使用しているようですが、私は今回、Antigravity CLI(以下agy)を使って行こうとおもいます。

Antigravity CLI (agy) とは?
GoogleのGemini APIをバックエンドに採用した、国内で開発中の最近話題のオープンソースCLIエージェントです。
https://antigravity.google/product/antigravity-cli

あと今回は私の意見と、AIを多用している旨はご了承願います

「寝る前に『テストが通るまでバグを修正しておいて』とエージェントに頼んでベッドに入り、翌朝起きたら完璧にマージ可能なプルリクエスト(PR)ができあがっている」

書籍からの引用です。『Loop Engineering』によると、ある開発者がこの夢を実行したところ、翌朝彼を待っていたのは完璧なコードではなく、91回に及ぶ無駄なレビューの周回(ラウンド)と、200ドル(約3万円)のAPI請求書という話がありました。
原文ではこうです
A builder on the Claude Code subreddit went to bed with a loop running. The idea was reasonable, even responsible: let an agent review his code over and over, fixing what it found, so he'd wake up to something cleaner than he left. He woke up to 91 review rounds and a $200 bill. The loop had reviewed, found something to change, changed it, reviewed again, found something else, changed that, and kept going.

Cook, J. Claude Code Loop Engineering: Build Self-Correcting Agentic Loops That Ship Trusted Code, Not a $200 Overnight Bill (English Edition) (p. 2). (Function). Kindle Edition.

APIって結構高いですよね。
関係ないかもしれませんが、僕はAPIコールしても結果が帰ってこなかったこともあり、お金が垂れ流しになったこともあります。
僕の場合はイライラしても、その場にいたのでなんとかなりますがほったらかしだと中々おそろしいですね
本連載では、AIエージェントの暴走を防ぎ安全に自律開発させる「ループエンジニアリング(LoopEngineering)」を読んでいこうと思います。

また、繰り返しですが原作は Claude Code を前提としていますが、本連載では「Antigravity CLI (agy)」を前提とした実践コマンドを紹介します。


1. 原作はどう扱っている? 「ループが200ドルを燃やした夜」の真実

原作の第1章では、この「200ドルを溶かした事件」の原因について、非常に示唆に富む分析を行っています。

暴走の原因は「モデルの知能」ではない

開発者がエージェントに与えた指示は以下のようなものでした。

/goal the code review finds no remaining issues
(コードレビューで指摘事項が一つもなくなること)

このコードをagyによませると
Claude 3.5 Sonnet をバックエンドに持つ Claude Codeでこれを実行すると、以下のプロセスで破滅に向かいます。
っていわれました

「もう止まれ」と指示するブレーキがどこにも存在しなかったからです。

一方agyによるとagyにまかせるとこうなるようです

パターンA:安全対策(予算上限)を設定していた場合

予算を3ドルに縛って実行

パターンA:安全対策(予算上限)を設定していた場合

APIの累積利用料が**3ドルに達した瞬間に、agy(強制終了)**します。
(agyはそう言っているけど、果たしてどうかは不明です。)

パターンB:完全にブレーキを外し、かつ安価な Flashモデルを使用した場合

• 挙動: Claude同様に90周以上ループし続けます。
 • 結果: しかし、Gemini 1.5 Flash の入力トークン単価($0.075 / 1M)は Sonnet の 40分の1

となるそうです。もちろん鵜呑みにはしません。あくまでagyの意見です。
いやいや、やすいからっても、地理も積もれば山となるでしょうに。
もっとも最近のAI使用量は上昇傾向にあるようなので怖い話です。

ってか思うのですが、AIの意見に質問したいのですが、トークンがいくら低くてもループを回し続けるのはよくないとおもいますが・・・・

ループはコスト上昇の要因ではあるが・・・

原作は、この恐怖体験からエンジニアリングの課題へと視点を転換させるために、以下のルールを提唱しています。

「AIモデルがほぼタダ同然でコードを書くようになった今、最もコストがかかるのはコードの作成ではなく、その周囲で実行される『ループ』である。」
とAIが行っているが、パターンBでは単価が安いから、リスクヘッジができているって言ってないか??
ループ以外にもコストの主因はありそう。トークンの価格でも変わるだろうし。
コストは単価ではなく「実行回数 × ループ設計」で決まるのでは・・・・?
電気代だってどうなのだろう。ここは推測になるがコストはトータルで考えるべきなのではとおもってしまう
そしてループが、あなたがコントロール可能の一つな部分なのかなとは思う。


2. 徹底比較:Claude Code vs Antigravity CLI (agy)

今回の記事のテーマであるclaude codeとagyの違いです
まあ単純比較はできないですし、そもそもagyの回答です。参考にしてください。
なお値段はこの記事の投稿しいている日を参考にしてください。

| 比較項目 | Claude Code | Antigravity CLI (agy) |
| バックエンドモデル | Claude 3.5 Sonnet | Gemini 1.5 Pro / Flash |
| トークン単価 (入力) | $3.00 / 1M tokens (高価) | $1.25 (Pro) / $0.075 (Flash) (超安価) |
| プロンプトキャッシュ | 有効 (5分間の対話維持が必要) | 強力かつ持続的 (Geminiのキャッシュにより、周回時のコストが最大90%オフ) |
| 自動実行時のリスク | 1回の暴走で数万〜数十万円が瞬時に溶ける | 超低コスト(Flash併用)+堅牢な予算上限で数ドル以内に収まる |
| フック・設定の制御 | 標準機能のみ | JavaScript/Bash による高度なフック割り当て |

agyに色々問い合わせるとこんな感じの答え

なぜ実際に動かすのは agy なのか?

自律ループでは、エージェントが「過去の会話ログ全体(コンテキスト)」を毎ターン再読み込みします。周回を重ねるごとにコンテキストが雪だるま式に膨らむため、Claude 3.5 Sonnet のような入力単価の高いモデルをクローズドループで何周も回すと、それだけでコストが爆発します。
Antigravity CLI (agy) は、バックエンドに Gemini API を採用しているため、1.5 Flash などの超軽量・低単価モデルをレビュー役(Checker)に割り当てたり、強力なコンテキストキャッシュを効かせることで、「自律ループの実行コストを Claude Code の 1/10 〜 1/100 規模に抑え込む」 ことが可能です。

ということらしい

なぜ多くのループが失敗し、既存の本は役に立たないのか

ほとんどのAIループが失敗する理由は、極めてシンプルです。
「いつ止まるべきかを教えておらず、自分の仕事が成功したかを確認する手段も与えていないから」

「終了条件(Exit Condition)」「検証ゲート(Verification Gate)」 です

ふむふむAIハーネスと何が違うのだ??
と思い、しらべたら、違う概念らしい。
ハーネス=評価システム、ループ=実行システム
らしい

なかなか勉強になる

不定期ですが、必ず更新します
今日はこれまで、読んでいただいた方ありがとうございます。

2
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?