第1部はこちら → https://qiita.com/REALKTMR/items/325e5c5726c0989ade1c
第2部はこちら → https://qiita.com/REALKTMR/items/0bafb70313b6d3dff3a9
第3部はこちら → https://qiita.com/REALKTMR/items/26e19c1559972a0aa5ea
はじめに
第1〜3部ではKiroで AWS三層アーキテクチャのCloudFormationテンプレートを生成・評価・自動変更管理 する話を書いてきました。
今回はちょっと別の角度から。
「Kiroって月$20で本当にどれくらい使えるの?Claude Codeと比べてどうなの?」
を検証してみました。同じタスク(CloudFormationテンプレート生成)を 3つの条件で実行し、消費リソースと出力品質を実測比較 しました。
比較対象と料金体系
Kiro Pro(月$20)
Kiroは「クレジット」という独自単位でAI使用量を管理します。
| プラン | 月額 | 月間クレジット | 超過料金 |
|---|---|---|---|
| Free | $0 | 50クレジット | なし |
| Pro | $20 | 1,000クレジット | $0.04/クレジット |
| Pro+ | $40 | 2,000クレジット | $0.04/クレジット |
| Power | $200 | 10,000クレジット | $0.04/クレジット |
Claude Code Pro(月$20)
Claude Codeは「トークン」で消費を管理しますが、Proプランはトークン課金ではなく使用量ベースのレートリミットが掛かります。
| 制限 | 内容 |
|---|---|
| セッション枠 | 5時間ウィンドウで10〜40プロンプト(コードサイズによる) |
| 週次枠 | 週単位の上限あり(非公開) |
| 上限到達時 | 数時間〜翌日まで使用不可 |
KiroにはAutoモードがある
Kiroにはモデルを手動選択するモードと、「Auto」 という自動選択モードがあります。
公式説明によると:
Auto combines multiple frontier models with optimization techniques to deliver the best quality-to-cost ratio and automatically chooses the optimal model for each task while delivering Sonnet 4-class results.
要するに「品質はSonnet 4レベルを維持しつつ、コストを自動最適化する」というモードです。はたしてほんとにAutoモードでもSonnet 4レベルになるのか!?
モデル別クレジット倍率(公式)
Kiroは同じプロンプトでも、選択するモデルによって消費クレジットが変わります。
| モデル | クレジット倍率 | 備考 |
|---|---|---|
| Auto | 1.0x(基準) | ルーターが自動選択 |
| Claude Sonnet 4.6 | 1.3x | Autoより30%高い |
| Claude Opus | 2.2x | 最高品質・最高コスト |
| Claude Haiku | 0.4x | 軽量・高速 |
| DeepSeek v3.2 | 0.25x | MoEアーキテクチャ |
| MiniMax 2.1 | 0.15x | 超軽量 |
| Qwen3 Coder Next | 0.05x | コーディング特化・最安 |
モデル使用履歴は取れるのか?
「じゃあAutoが実際にどのモデルを使っているか確認すればいい」と思うかもしれません。
調べた結果:取れません。
取れる情報
- プロンプトごとの消費クレジット数(チャットパネルに表示)
- 月間の残クレジット数(ダッシュボード、5分おきに更新)
取れない情報
- どのモデルが選択されたか(Autoモード使用時)
- プロンプトの複雑度とモデル選択の関係
- サブエージェント(Agent Hooks等)ごとの内訳
実際、Kiroの公開GitHubリポジトリには透明性を求めるFeature Requestが出ています。
Issue #6213: Transparency on credits usage in IDE subagents
「メインエージェントの消費は見えるが、サブエージェントが使ったクレジットが集計されない」という問題提起。執筆時点(2026年4月)では未対応。
つまり、Autoが何を使っているかは「クレジット消費量から逆算するしかない」のです。
実験設計
タスク:前シリーズと同じCloudFormationテンプレート生成
第1〜3部で使ったAWS三層アーキテクチャの生成タスクを再利用します。
AWS三層アーキテクチャ(ALB → EC2 AutoScaling → RDS Multi-AZ)の
CloudFormationテンプレートをWell-Architected Frameworkに準拠して生成してください。
以下の要件を含めること:
- HTTPSのみ(ACM証明書)
- WAF + Shield Standard(AWSマネージドルールグループを使用)
- CloudTrail + Config + GuardDuty
- S3バックアップ(ライフサイクルポリシー含む)
- RDS: gp3ストレージ、暗号化、自動バックアップ
その後、2つの追加指示を与えます:
- ターン2:「WAFにAWSManagedRulesAmazonIpReputationListのルールグループを追加してください」
- ターン3:「RDSのバックアップ保持期間を30日に変更してください」
3条件
| 条件 | ツール | モデル設定 |
|---|---|---|
| A | Kiro | Auto(デフォルト) |
| B | Kiro | Claude Sonnet 4.6(手動指定・1.3x) |
| C | Claude Code | デフォルト(Claude Sonnet 4.6) |
実測結果
条件A:Kiro Auto
Kiro IDEのチャットパネルに表示された実測値:
【ターン1】初期生成 Est. Credits Used: 1.94 Elapsed time: 2m 18s
【ターン2】WAF追加 Est. Credits Used: 0.19 Elapsed time: 11s
【ターン3】RDS修正 Est. Credits Used: 0.14 Elapsed time: 7s
| ターン | 操作内容 | Est. Credits | 経過時間 |
|---|---|---|---|
| 1 | テンプレート初期生成 | 1.94 | 2m 18s |
| 2 | WAF追加 | 0.19 | 11s |
| 3 | RDS修正 | 0.14 | 7s |
| 合計 | 2.27 | 2m 36s |
条件B:Kiro Sonnet 4.6
Kiro IDEのチャットパネルに表示された実測値:
【ターン1】初期生成 Est. Credits Used: 2.83 Elapsed time: 2m 42s
【ターン2】WAF追加 Est. Credits Used: 0.41 Elapsed time: 14s
【ターン3】RDS修正 Est. Credits Used: 0.21 Elapsed time: 7s
| ターン | 操作内容 | Est. Credits | 経過時間 |
|---|---|---|---|
| 1 | テンプレート初期生成 | 2.83 | 2m 42s |
| 2 | WAF追加 | 0.41 | 14s |
| 3 | RDS修正 | 0.21 | 7s |
| 合計 | 3.45 | 3m 3s |
条件C:Claude Code Pro(参考)
Claude Code ProはKiroのような「クレジット」単位を持たず、カウント方式がまったく異なるため直接比較はできません。今回は専用プロジェクト(Blog/blog4_claude)でセッションを分離し、claude-usageを使って計測しました。
| 指標 | 値 |
|---|---|
| モデル | claude-sonnet-4-6 |
| ターン数 | 15 |
| 入力トークン | 27K |
| 出力トークン | 16.3K |
| 所要時間 | 4.6m |
| API換算コスト | $0.6560 |
Kiroとはカウント方式が異なりますが、API換算で算出すると Kiro Auto(2.27cr × $0.02 ≒ $0.045)の約14倍 1という参考値が出ました。Claude Code Proは定額$20のサブスクリプションなので実際にこの金額が引かれるわけではありませんが、消費リソースの大きさの目安にはなります。
なお、Kiroが3ターンで完了したのに対しClaude Codeでは15ターンかかっています。なぜ、こういう差が出たのかは謎ですが、Kiroはかなり効率がいいと言えますね。
出力品質は後述のテンプレート比較で評価します。
Claude Code Proで注意が必要なのはレートリミットです。Kiroのようにクレジット残量が数字で見えるわけではなく、「5時間利用枠」と「週次利用枠」 という2種類の上限に当たると一定時間使用不可になります。重い作業が続くと週の途中で制限されることも多く、「いつ止まるかわからない」という点が実務上のネックになります。
考察
Auto vs Sonnet 4.6:コスト差の逆算
Sonnet ÷ Auto = 3.45 ÷ 2.27 = 1.52x
→ SonnetはAutoより52%多くクレジットを消費した
→ Autoの実質倍率 = 2.27 ÷ 3.45 × 1.3 ≒ 0.86x
公式倍率と照合すると:
| モデル | 公式倍率 |
|---|---|
| Haiku | 0.4x |
| Auto実質 | ≒ 0.86x ←ここ |
| Sonnet 4.6 | 1.3x |
HaikuよりはSonnetに近い帯域で動作しているようです。ターンごとに見ると差がばらつくのも特徴的で、複雑なターン2(WAF追加)ではSonnetがAutoの2.2倍のクレジットを消費しています。単純な修正であるほどAutoが安く済む傾向が読み取れます。
テンプレート品質比較
コスト比較だけでなく、生成されたテンプレートの中身も比較しました。
この比較が今回の最大の発見です。
Autoは安いだけでなく、品質でも上回る項目がありました。
機能差一覧
| 機能 | Kiro Auto | Kiro Sonnet | Claude Code |
|---|---|---|---|
| VPC Flow Logs | ✓ | ✓(KMS暗号化) | ✓(KMS暗号化) |
| KMS CMK(サービス別独立キー) | ✓ RDS/S3別 | ✓ 共有1キー | ✓ 共有1キー |
| SecretsManager(DBパスワード自動生成) | ✅ 自動採用 | ✗(NoEcho param) | ✗(NoEcho param) |
| NAT Gateway HA(2AZ) | ✓ | ✓ | ✓ |
| ALBアクセスログ用S3 | ✓(専用バケット) | ✗ | ✓(CloudTrailと兼用) |
| ALB drop_invalid_header_fields | ✓ | ✗ | ✓ |
| CloudTrail → CloudWatch Logs連携 | ✓ | ✗ | ✓ |
| Config専用S3バケット | ✓ | ✗(CloudTrailと兼用) | ✗(LogBucketと兼用) |
| S3 DEEP_ARCHIVEライフサイクル | ✓ | ✗ | ✓ |
| AbortIncompleteMultipartUpload | ✓ | ✗ | ✓ |
| ASG ローリングアップデートポリシー | ✓ | ✗ | ✗ |
| RDS空き容量アラーム(10GB未満) | ✓ | ✗ | ✓ |
| Metadata(コンソールUI整形) | ✗ | ✓ | ✓ |
| Email通知(SNS購読) | ✗(Topicのみ) | ✓ | ✗(Topicのみ) |
AZ汎用指定(!GetAZs) |
✓ | ✓ | ✓ |
!Cidr関数で動的CIDR割当 |
✗ | ✓ | ✗ |
注目ポイント:DBパスワードの扱い
DBパスワードの管理方法に如実にモデルの「考え方」が出ました。
DBSecret:
Type: AWS::SecretsManager::Secret
Properties:
GenerateSecretString:
PasswordLength: 32
ExcludeCharacters: '"@/\'
RDSInstance:
MasterUserPassword: !Sub '{{resolve:secretsmanager:${DBSecret}:SecretString:password}}'
DBMasterPassword:
Type: String
NoEcho: true
MinLength: 12
RDSInstance:
MasterUserPassword: !Ref DBMasterPassword
Kiro AutoはDBパスワードをパラメータとして受け取らず、SecretsManagerで自動生成して動的参照しています。デプロイ時にパスワードを人間が知る必要がなく、ローテーション対応も容易です。インフラエンジニア目線では圧倒的にAutoの実装が正しい。
まとめ
今回の実験で得られた結論を整理します。
思った以上にKiro特にAutoモード優秀ですね。コストも抑え、品質もいい!
こと、CFn対応ならこれはもうKiro一択でしょ。素晴らしい (^_^)/
| 検証項目 | 結果 |
|---|---|
| Kiro Autoのモデル使用履歴 | 取れない(クレジット量からの逆算のみ) |
| Auto vs Sonnet 4.6のコスト差 | Autoが34%安い(2.27 vs 3.45クレジット) |
| Autoの実質モデル帯域 | HaikuとSonnetの中間(≒ 0.86x) |
| テンプレート品質 | AutoがSecretsManager・KMS別キー等で優位。Claude CodeはKiro Sonnet相当 |
| Claude Code API換算コスト | $0.6560(15ターン)≒ Kiro Autoの約14倍 |
| Claude Codeのレートリミット | 5時間枠・週次枠の2段階制限。重い作業が続くと週の途中で止まる |
今回最大の発見:KiroのAutoモードは安いだけでなく、Sonnet指定より高機能なテンプレートを生成した。
「安いモデルを使うから品質が落ちる」という先入観は崩れました。Autoのルーターは コストだけでなく出力の完成度も最適化している 可能性があります。
月$20の使い心地比較
| 観点 | Kiro Auto | Kiro Sonnet 4.6 | Claude Code Pro |
|---|---|---|---|
| 月間上限 | 1,000クレジット | 同左 | レートリミット依存 |
| 同タスクのコスト | 2.27 cr(≒$0.045) | 3.45 cr(≒$0.069) | $0.6560(API換算) |
| 上限の透明性 | ◎ 残クレジットが見える | 同左 | △ いつ止まるか不明 |
| 止まった後 | 追加購入($0.04/cr)か翌月 | 同左 | 数時間〜翌日待ち |
| テンプレート品質 | ◎ | ○ | ○ |
参考リンク
- Kiro Pricing
- Kiro Models - 公式ドキュメント
- Kiro Model selection
- Open weight models are here(Kiro Blog)
- Understanding Kiro's pricing(Kiro Blog)
- Issue #6213: Transparency on credits usage in IDE subagents
- Announcing new pricing plans and Auto(Kiro Blog)
-
※ Kiroのクレジット単価はPro月額($20/1,000cr = $0.02/cr)から算出。実際の使用量によって実質単価は変わります。 ↩