1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【Kiro活用】"燃費"を実測してみた ― Autoモードの性能はいかに?

1
Last updated at Posted at 2026-04-10

第1部はこちらhttps://qiita.com/REALKTMR/items/325e5c5726c0989ade1c
第2部はこちらhttps://qiita.com/REALKTMR/items/0bafb70313b6d3dff3a9
第3部はこちらhttps://qiita.com/REALKTMR/items/26e19c1559972a0aa5ea


はじめに

第1〜3部ではKiroで AWS三層アーキテクチャのCloudFormationテンプレートを生成・評価・自動変更管理 する話を書いてきました。

今回はちょっと別の角度から。

「Kiroって月$20で本当にどれくらい使えるの?Claude Codeと比べてどうなの?」

を検証してみました。同じタスク(CloudFormationテンプレート生成)を 3つの条件で実行し、消費リソースと出力品質を実測比較 しました。


比較対象と料金体系

Kiro Pro(月$20)

Kiroは「クレジット」という独自単位でAI使用量を管理します。

プラン 月額 月間クレジット 超過料金
Free $0 50クレジット なし
Pro $20 1,000クレジット $0.04/クレジット
Pro+ $40 2,000クレジット $0.04/クレジット
Power $200 10,000クレジット $0.04/クレジット

Claude Code Pro(月$20)

Claude Codeは「トークン」で消費を管理しますが、Proプランはトークン課金ではなく使用量ベースのレートリミットが掛かります。

制限 内容
セッション枠 5時間ウィンドウで10〜40プロンプト(コードサイズによる)
週次枠 週単位の上限あり(非公開)
上限到達時 数時間〜翌日まで使用不可

KiroにはAutoモードがある

Kiroにはモデルを手動選択するモードと、「Auto」 という自動選択モードがあります。

公式説明によると:

Auto combines multiple frontier models with optimization techniques to deliver the best quality-to-cost ratio and automatically chooses the optimal model for each task while delivering Sonnet 4-class results.

要するに「品質はSonnet 4レベルを維持しつつ、コストを自動最適化する」というモードです。はたしてほんとにAutoモードでもSonnet 4レベルになるのか!?

モデル別クレジット倍率(公式)

Kiroは同じプロンプトでも、選択するモデルによって消費クレジットが変わります。

モデル クレジット倍率 備考
Auto 1.0x(基準) ルーターが自動選択
Claude Sonnet 4.6 1.3x Autoより30%高い
Claude Opus 2.2x 最高品質・最高コスト
Claude Haiku 0.4x 軽量・高速
DeepSeek v3.2 0.25x MoEアーキテクチャ
MiniMax 2.1 0.15x 超軽量
Qwen3 Coder Next 0.05x コーディング特化・最安

モデル使用履歴は取れるのか?

「じゃあAutoが実際にどのモデルを使っているか確認すればいい」と思うかもしれません。

調べた結果:取れません。

取れる情報

  • プロンプトごとの消費クレジット数(チャットパネルに表示)
  • 月間の残クレジット数(ダッシュボード、5分おきに更新)

取れない情報

  • どのモデルが選択されたか(Autoモード使用時)
  • プロンプトの複雑度とモデル選択の関係
  • サブエージェント(Agent Hooks等)ごとの内訳

実際、Kiroの公開GitHubリポジトリには透明性を求めるFeature Requestが出ています。

Issue #6213: Transparency on credits usage in IDE subagents

「メインエージェントの消費は見えるが、サブエージェントが使ったクレジットが集計されない」という問題提起。執筆時点(2026年4月)では未対応。

つまり、Autoが何を使っているかは「クレジット消費量から逆算するしかない」のです。


実験設計

タスク:前シリーズと同じCloudFormationテンプレート生成

第1〜3部で使ったAWS三層アーキテクチャの生成タスクを再利用します。

使用プロンプト(条件A・B共通)
AWS三層アーキテクチャ(ALB → EC2 AutoScaling → RDS Multi-AZ)の
CloudFormationテンプレートをWell-Architected Frameworkに準拠して生成してください。
以下の要件を含めること:
- HTTPSのみ(ACM証明書)
- WAF + Shield Standard(AWSマネージドルールグループを使用)
- CloudTrail + Config + GuardDuty
- S3バックアップ(ライフサイクルポリシー含む)
- RDS: gp3ストレージ、暗号化、自動バックアップ

その後、2つの追加指示を与えます:

  • ターン2:「WAFにAWSManagedRulesAmazonIpReputationListのルールグループを追加してください」
  • ターン3:「RDSのバックアップ保持期間を30日に変更してください」

3条件

条件 ツール モデル設定
A Kiro Auto(デフォルト)
B Kiro Claude Sonnet 4.6(手動指定・1.3x)
C Claude Code デフォルト(Claude Sonnet 4.6)

実測結果

条件A:Kiro Auto

Kiro IDEのチャットパネルに表示された実測値:

【ターン1】初期生成 Est. Credits Used: 1.94  Elapsed time: 2m 18s
【ターン2】WAF追加  Est. Credits Used: 0.19  Elapsed time: 11s
【ターン3】RDS修正 Est. Credits Used: 0.14  Elapsed time: 7s
ターン 操作内容 Est. Credits 経過時間
1 テンプレート初期生成 1.94 2m 18s
2 WAF追加 0.19 11s
3 RDS修正 0.14 7s
合計 2.27 2m 36s

条件B:Kiro Sonnet 4.6

Kiro IDEのチャットパネルに表示された実測値:

【ターン1】初期生成  Est. Credits Used: 2.83  Elapsed time: 2m 42s
【ターン2】WAF追加  Est. Credits Used: 0.41  Elapsed time: 14s
【ターン3】RDS修正 Est. Credits Used: 0.21  Elapsed time: 7s
ターン 操作内容 Est. Credits 経過時間
1 テンプレート初期生成 2.83 2m 42s
2 WAF追加 0.41 14s
3 RDS修正 0.21 7s
合計 3.45 3m 3s

条件C:Claude Code Pro(参考)

Claude Code ProはKiroのような「クレジット」単位を持たず、カウント方式がまったく異なるため直接比較はできません。今回は専用プロジェクト(Blog/blog4_claude)でセッションを分離し、claude-usageを使って計測しました。

指標
モデル claude-sonnet-4-6
ターン数 15
入力トークン 27K
出力トークン 16.3K
所要時間 4.6m
API換算コスト $0.6560

Kiroとはカウント方式が異なりますが、API換算で算出すると Kiro Auto(2.27cr × $0.02 ≒ $0.045)の約14倍 1という参考値が出ました。Claude Code Proは定額$20のサブスクリプションなので実際にこの金額が引かれるわけではありませんが、消費リソースの大きさの目安にはなります。

なお、Kiroが3ターンで完了したのに対しClaude Codeでは15ターンかかっています。なぜ、こういう差が出たのかは謎ですが、Kiroはかなり効率がいいと言えますね。

出力品質は後述のテンプレート比較で評価します。

Claude Code Proで注意が必要なのはレートリミットです。Kiroのようにクレジット残量が数字で見えるわけではなく、「5時間利用枠」と「週次利用枠」 という2種類の上限に当たると一定時間使用不可になります。重い作業が続くと週の途中で制限されることも多く、「いつ止まるかわからない」という点が実務上のネックになります。


考察

Auto vs Sonnet 4.6:コスト差の逆算

実質倍率の計算
Sonnet ÷ Auto = 3.45 ÷ 2.27 = 1.52x

→ SonnetはAutoより52%多くクレジットを消費した
→ Autoの実質倍率 = 2.27 ÷ 3.45 × 1.3 ≒ 0.86x

公式倍率と照合すると:

モデル 公式倍率
Haiku 0.4x
Auto実質 ≒ 0.86x ←ここ
Sonnet 4.6 1.3x

HaikuよりはSonnetに近い帯域で動作しているようです。ターンごとに見ると差がばらつくのも特徴的で、複雑なターン2(WAF追加)ではSonnetがAutoの2.2倍のクレジットを消費しています。単純な修正であるほどAutoが安く済む傾向が読み取れます。


テンプレート品質比較

コスト比較だけでなく、生成されたテンプレートの中身も比較しました。

この比較が今回の最大の発見です。

Autoは安いだけでなく、品質でも上回る項目がありました。

機能差一覧

機能 Kiro Auto Kiro Sonnet Claude Code
VPC Flow Logs ✓(KMS暗号化) ✓(KMS暗号化)
KMS CMK(サービス別独立キー) RDS/S3別 ✓ 共有1キー ✓ 共有1キー
SecretsManager(DBパスワード自動生成) 自動採用 ✗(NoEcho param) ✗(NoEcho param)
NAT Gateway HA(2AZ)
ALBアクセスログ用S3 ✓(専用バケット) ✓(CloudTrailと兼用)
ALB drop_invalid_header_fields
CloudTrail → CloudWatch Logs連携
Config専用S3バケット ✗(CloudTrailと兼用) ✗(LogBucketと兼用)
S3 DEEP_ARCHIVEライフサイクル
AbortIncompleteMultipartUpload
ASG ローリングアップデートポリシー
RDS空き容量アラーム(10GB未満)
Metadata(コンソールUI整形)
Email通知(SNS購読) ✗(Topicのみ) ✗(Topicのみ)
AZ汎用指定(!GetAZs
!Cidr関数で動的CIDR割当

注目ポイント:DBパスワードの扱い

DBパスワードの管理方法に如実にモデルの「考え方」が出ました。

Kiro Auto(SecretsManagerで自動生成)
DBSecret:
  Type: AWS::SecretsManager::Secret
  Properties:
    GenerateSecretString:
      PasswordLength: 32
      ExcludeCharacters: '"@/\'

RDSInstance:
  MasterUserPassword: !Sub '{{resolve:secretsmanager:${DBSecret}:SecretString:password}}'
Kiro Sonnet・Claude Code(パラメータで受け取る)
DBMasterPassword:
  Type: String
  NoEcho: true
  MinLength: 12

RDSInstance:
  MasterUserPassword: !Ref DBMasterPassword

Kiro AutoはDBパスワードをパラメータとして受け取らず、SecretsManagerで自動生成して動的参照しています。デプロイ時にパスワードを人間が知る必要がなく、ローテーション対応も容易です。インフラエンジニア目線では圧倒的にAutoの実装が正しい。


まとめ

今回の実験で得られた結論を整理します。
思った以上にKiro特にAutoモード優秀ですね。コストも抑え、品質もいい!
こと、CFn対応ならこれはもうKiro一択でしょ。素晴らしい (^_^)/

検証項目 結果
Kiro Autoのモデル使用履歴 取れない(クレジット量からの逆算のみ)
Auto vs Sonnet 4.6のコスト差 Autoが34%安い(2.27 vs 3.45クレジット)
Autoの実質モデル帯域 HaikuとSonnetの中間(≒ 0.86x)
テンプレート品質 AutoがSecretsManager・KMS別キー等で優位。Claude CodeはKiro Sonnet相当
Claude Code API換算コスト $0.6560(15ターン)≒ Kiro Autoの約14倍
Claude Codeのレートリミット 5時間枠・週次枠の2段階制限。重い作業が続くと週の途中で止まる

今回最大の発見:KiroのAutoモードは安いだけでなく、Sonnet指定より高機能なテンプレートを生成した。

「安いモデルを使うから品質が落ちる」という先入観は崩れました。Autoのルーターは コストだけでなく出力の完成度も最適化している 可能性があります。

月$20の使い心地比較

観点 Kiro Auto Kiro Sonnet 4.6 Claude Code Pro
月間上限 1,000クレジット 同左 レートリミット依存
同タスクのコスト 2.27 cr(≒$0.045) 3.45 cr(≒$0.069) $0.6560(API換算)
上限の透明性 ◎ 残クレジットが見える 同左 △ いつ止まるか不明
止まった後 追加購入($0.04/cr)か翌月 同左 数時間〜翌日待ち
テンプレート品質


参考リンク

  1. ※ Kiroのクレジット単価はPro月額($20/1,000cr = $0.02/cr)から算出。実際の使用量によって実質単価は変わります。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?