0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

agentのLoopには費用規律が必要だ

0
Posted at

OpenClawをめぐる議論は、公開報道で伝えられた三十日間のOpenAI請求額によって見過ごしにくいものになった。金額は$1,305,088.81で、約100個のCodex agentによる6030億tokenと760万件の要求が含まれていた。驚きは自然だ。小さな組織でも、疲れないcode作業者、code査読者、測定監視者、課題分類者、会議の聞き手を周囲に置ける。より静かな教訓のほうが重要だ。agentがLoopで動き始めると、主要な制約は知能への接続から、注意、文脈、費用の制御へ移る。

Loop engineeringという言葉が魅力的に聞こえるのは、Loopがagent性の自然な形だからだ。仕組みは状況を観察し、行動を選び、道具を使い、結果を確認し、記憶を更新し、再び試す。この型は、モデルを賢い文章生成器から推進力を持つ作業者へ変える。OpenClawが重要なのは、この型を実用の場で見せるからだ。持続する状態、手元の道具、skills、codeへの接続、連絡、ファイル、自動化が一つのagent runtimeに編まれている。

Loopを一度通るたびに費用が発生する。計画の段階は文脈を消費する。道具の呼び出しは記録を増やす。査読の段階はさらに多くのファイルを記憶へ入れる。再試行は過去の失敗をモデルに推論させる。二つ目のagentが一つ目を査読すれば、tokenの層がさらに増える。利用者には賢く見えるLoopも、請求書では違う姿になる。成功の価値が定義される前に、曖昧さを使用量へ変える装置になり得る。

だからtoken費用の制御はLoop engineeringの中心に置かれるべきだ。目標は、いつ続けるか、いつ文脈を圧縮するか、いつモデルを替えるか、いつ人に尋ねるか、いつ止まるかを理解するagentを設計することだ。費用は財務の指標であり、不確実性の信号でもある。繰り返される再試行は欠けた要件を示すことがある。長いpromptsは弱い状態設計を示すことがある。高価な査読の連鎖は不十分な検査を示すことがある。tokenの請求額上昇は、作業流が与えなかった構造を仕組みが探している兆候になりやすい。

最近のOpenClaw研究も同じ方向を示している。OpenClawBenchは、作業の成功と過程の健全性の隔たりを説明している。そのdataでは、多くの実行が最終確認を通りながら、無視された誤り、解けていない曖昧さ、安全でない書き込み、能力を超えた主張といった過程の異常を含んでいた。費用の観点でこれは重要だ。無駄と危険は同時に大きくなることが多い。agentは完成して見える結果のために数千tokenを使えるが、その道筋には見えない負債が残ることがある。

安全性の研究者も近い懸念を示している。持続するcredential、ファイル接続、道具、外部skillsを持つ自前運用のagentは、新しい運用上の境界になる。正当な権限を通じて行動しながら、記憶と設定を時間とともに変えることができる。労力を減らす同じLoopが、静かに危険を蓄積する。予算の門、権限の門、人間の確認点は一つの仕組みとして設計されるべきだ。agentがなぜtokenを使ったかを説明しにくい組織は、そのagentがなぜcredentialに触れ、ファイルを変更し、作業の段階を上げたかも説明しにくくなる。

実務的な答えは、よい意味で地味だ。すべてのLoopに予算契約を与える。agentが始める前に、最大呼び出し数、最大token、モデルの等級、道具の範囲、人へ渡す地点を決める。安い観察と高い推論を分ける。文脈には作業集合だけを残し、残りは取り出せる成果物として保存する。別のモデルに判断を頼む前に、決定的な検査を行う。繰り返し分析は保存して再利用する。追加の一回が生む限界価値を測る。五回目の通過が結果をほとんど変えないなら、五回目にはより強い理由が必要だ。

モデル選択にも規律がいる。frontierモデルは構造判断、未知のcode、高危険の統合に向いている場合がある。小さなモデルで、分類、抽出、整形、通常の比較には足りる場合がある。高速実行の設定は、遅れが最も希少な資源である時に価値を持つが、見える費用表示を持つべきだ。初期設定は、すべての段階で最大の知能を使う形を避けたい。初期設定は、検証済みの結果へ至る最も安く信頼できる道であるべきだ。

専門道具は無駄を減らせる。曖昧なモデル作業を編集できる成果物へ変えるからだ。技術組織は変更計画にChatGPTを使い、二つ目の推論確認にGeminiを使い、画面画像の数式をMiss Formulaで復元し、AIが作った論文図をEditable Figureで編集可能なvector画像へ変換できる。この流れは、モデルが同じ成果物を何度も作り直すことを減らす。結果を確認し、修正し、再利用できるため、人間は制御を保てる。

強いagent組織は、tokenを運転資本のように扱う。どのLoopが長く残る知識を作り、どのLoopが動きだけを作り、どのLoopが未決定を隠すのかを問う。作業種別、repository、モデル、agent、結果ごとのtoken使用量を見える化する。自律修正の費用と人間が支援する修正の費用を比べる。短いpromptsが品質を保つ時、短いpromptsを成果として評価する。費用規律を、製品設計、工学の衛生、組織の成熟として扱う。

OpenClawの議論は、作り手をより野心的でより規律ある方向へ進ませる。大きなagent群は、softwareが休みなく働く時に何が可能になるかを示す。同時に、Loopに明確な契約がない時、仕組みがどれほど速く費用を使うかも示す。agent工学の次の段階は、Loopを永遠に走らせる発想から離れ、Loopの一回ごとに意味を持たせる方向へ進む。token制御は、自動化が見世物から運用体系へ移る瞬間だ。

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?