VS Code Copilot Agent で使える AI モデル比較 - PlatformIO/ESP32 開発向け
はじめに
VS Code の GitHub Copilot Agent Mode では、複数の AI モデルを切り替えて使用できます。
本記事では、PlatformIO + ESP32 開発において、どのモデルが実用的かを評価しました。
評価環境
- VS Code + GitHub Copilot Extension
- PlatformIO 6.1.18
-
プロジェクト: DMX-TOOL(複数プラットフォーム)
- M5Stack CoreS3/Core2 (ESP32-S3/ESP32) - main.cpp 約1500行
- StampS3 (ESP32-S3) - ArtNet-DMX変換
- Wio Terminal (SAMD51) - LovyanGFX使用
- 評価項目: コード理解、ファイル編集、エラー対応、安定性、マルチプラットフォーム対応
プロジェクト構成
DMX-TOOL/
├── M5stack/ # ESP32-S3 / ESP32 (espressif32)
├── stamps3-dmx/ # ESP32-S3 (espressif32)
├── stamps3-ArtNet-wifi/ # ESP32-S3 (espressif32)
└── Wio_Terminal/ # SAMD51 (atmelsam) ← 異なるプラットフォーム
ポイント: ESP32系とSAMD51系で全く異なるアーキテクチャを扱う必要がある
使用可能モデル一覧(2026年1月時点)
| モデル | 倍率 | 提供元 |
|---|---|---|
| Claude Opus 4.5 | 3x | Anthropic |
| Claude Sonnet 4.5 | 1x | Anthropic |
| Claude Sonnet 4 | 1x | Anthropic |
| Claude Haiku 4.5 | 0.33x | Anthropic |
| GPT-5.2 | 1x | OpenAI |
| GPT-5.1 | 1x | OpenAI |
| GPT-5 | 1x | OpenAI |
| GPT-5 mini | 0x | OpenAI |
| Gemini 2.5 Pro | 1x | |
| Gemini 3 Pro | 1x | |
| Grok Code Fast 1 | 0x | xAI |
※ 倍率はトークン消費量の目安
📊 総合評価ランキング
🥇 Tier S(最強)
| モデル | コード理解 | ファイル編集 | エラー対応 | 安定性 | 総合 |
|---|---|---|---|---|---|
| Claude Opus 4.5 | ◎ | ◎ | ◎ | ◎ | ⭐⭐⭐⭐⭐ |
| Claude Sonnet 4.5 | ◎ | ◎ | ◎ | ◎ | ⭐⭐⭐⭐⭐ |
Claude Opus 4.5 は現時点で最高性能。1500行のC++コードを完全に理解し、複数ファイルにまたがる修正も正確に行える。
Claude Sonnet 4.5 はOpusの95%の性能を1/3のコストで実現。コスパ最強。
🥈 Tier A(実用十分)
| モデル | コード理解 | ファイル編集 | エラー対応 | 安定性 | 総合 |
|---|---|---|---|---|---|
| Claude Sonnet 4 | ○ | ◎ | ○ | ◎ | ⭐⭐⭐⭐ |
| GPT-5 | ○ | ○ | ○ | ○ | ⭐⭐⭐⭐ |
| GPT-5.1 / 5.2 | ○ | ○ | ○ | ○ | ⭐⭐⭐⭐ |
| Gemini 2.5 Pro | ○ | ○ | △ | ○ | ⭐⭐⭐⭐ |
日常的な開発作業には十分。エラー修正、機能追加ともに問題なく対応。
🥉 Tier B(軽作業向け)
| モデル | コード理解 | ファイル編集 | エラー対応 | 安定性 | 総合 |
|---|---|---|---|---|---|
| Claude Haiku 4.5 | △ | ○ | △ | ◎ | ⭐⭐⭐ |
| Gemini 3 Pro | △ | ○ | △ | ○ | ⭐⭐⭐ |
| Gemini 3 Flash | △ | △ | △ | ○ | ⭐⭐⭐ |
簡単な修正、コメント追加、フォーマット程度なら使える。
複雑なロジック変更は苦手。
❌ Tier C(非推奨)
| モデル | 問題点 |
|---|---|
| GPT-5 mini | コンテキスト短い、1000行超えると破綻 |
| GPT-4.1 / 4o | 古い、長いファイル対応不可 |
| Grok Code Fast 1 | PlatformIO/ESP32の知識不足 |
| Raptor mini | 組み込み開発の経験不足 |
🔄 マルチプラットフォーム対応評価
DMX-TOOLのようにESP32とSAMD51(Wio Terminal)を同時に扱うプロジェクトでは、両方のプラットフォームを理解しているかが重要。
| モデル | ESP32 | SAMD51 | LovyanGFX | M5Unified | 総合 |
|---|---|---|---|---|---|
| Claude Opus 4.5 | ◎ | ◎ | ◎ | ◎ | ⭐⭐⭐⭐⭐ |
| Claude Sonnet 4.5 | ◎ | ◎ | ◎ | ◎ | ⭐⭐⭐⭐⭐ |
| Claude Sonnet 4 | ○ | ○ | ○ | ○ | ⭐⭐⭐⭐ |
| GPT-5.1 / 5.2 | ○ | △ | △ | ○ | ⭐⭐⭐ |
| Gemini 2.5 Pro | ○ | △ | △ | ○ | ⭐⭐⭐ |
| Claude Haiku 4.5 | △ | × | △ | △ | ⭐⭐ |
| GPT-5 mini | × | × | × | × | ⭐ |
プラットフォーム別の難易度
| プラットフォーム | 難易度 | 理由 |
|---|---|---|
| ESP32 (M5Stack) | ★★★ | 情報豊富、AIの学習データも多い |
| ESP32-S3 (StampS3) | ★★★ | ESP32とほぼ同様 |
| SAMD51 (Wio Terminal) | ★★★★★ | 情報少ない、特殊な設定が必要 |
Wio Terminalの難しさ:
- Seeed Studio独自のArduinoCore
- LovyanGFXのSAMD向け設定が特殊
- UF2ブートローダーの扱い
- フラッシュ操作がESP32と異なる
✅ DMX-TOOL全体管理のベスト選択
🏆 推奨: Claude Sonnet 4.5
理由:
- ESP32/ESP32-S3の深い理解
- SAMD51(Wio Terminal)の特殊な設定も対応可能
- LovyanGFX、M5Unified両方のライブラリを熟知
- platformio.iniのマルチ環境設定に強い
- コスト効率が良い(Opus比1/3)
Claude Opus 4.5は最高性能だが、コスト3倍。
日常的な全体管理にはSonnet 4.5で十分。
🎯 用途別おすすめ
本格的な開発・リファクタリング
推奨: Claude Opus 4.5 または Claude Sonnet 4.5
- 大規模なコード変更
- アーキテクチャ設計
- 複数ファイルにまたがる修正
- デバッグが難しいバグの調査
日常的な機能追加・修正
推奨: Claude Sonnet 4 または GPT-5.1
- 新機能の追加
- バグ修正
- コードレビュー
- ドキュメント生成
軽い修正・質問
推奨: Claude Haiku 4.5
- 変数名の変更
- コメント追加
- 簡単な質問
- コスト節約したい場合
💡 PlatformIO/ESP32 開発での実例
例1: ビルドエラーの修正
プロンプト:
このビルドエラーを修正して
| モデル | 結果 |
|---|---|
| Claude Opus 4.5 | ✅ 即座に原因特定、修正提案 |
| Claude Sonnet 4.5 | ✅ 同上 |
| GPT-5 | ✅ 修正できるが説明が長い |
| Claude Haiku | △ 簡単なエラーは可、複雑だと的外れ |
例2: 新機能の追加
プロンプト:
DMX受信時にLED点滅する機能を追加して
| モデル | 結果 |
|---|---|
| Claude Opus 4.5 | ✅ 既存コード理解し適切な場所に追加 |
| Claude Sonnet 4.5 | ✅ 同上 |
| GPT-5 | ○ 追加できるが場所がやや不適切なことも |
| Claude Haiku | △ 追加はできるが他の機能に影響出ることも |
例3: platformio.ini の設定変更
プロンプト:
Core2用のビルド環境を追加して
| モデル | 結果 |
|---|---|
| Claude Opus 4.5 | ✅ 完璧な設定を生成 |
| Claude Sonnet 4.5 | ✅ 同上 |
| GPT-5 | ○ 基本は正しいが細かい設定漏れあり |
| Grok | ❌ PlatformIOの設定形式を間違える |
📈 コスト効率
| モデル | 倍率 | 1時間の作業 | コスパ |
|---|---|---|---|
| Claude Opus 4.5 | 3x | 高品質だが消費大 | ★★★ |
| Claude Sonnet 4.5 | 1x | Opus級の品質 | ★★★★★ |
| Claude Sonnet 4 | 1x | 十分な品質 | ★★★★ |
| Claude Haiku 4.5 | 0.33x | 軽作業向け | ★★★★ |
| GPT-5 mini | 0x (無料?) | 実用困難 | ★ |
結論: Claude Sonnet 4.5 がコスパ最強
🔧 設定方法
VS Code で モデルを切り替える方法:
- Copilot Chat を開く (
Ctrl+Shift+I) - 下部のモデル名をクリック
- リストから選択
推奨設定:
- 通常作業: Claude Sonnet 4.5
- 複雑な問題: Claude Opus 4.5
- 軽い質問: Claude Haiku 4.5
まとめ
| 目的 | 推奨モデル |
|---|---|
| 最高の結果が欲しい | Claude Opus 4.5 |
| コスパ重視(推奨) | Claude Sonnet 4.5 |
| マルチプラットフォーム管理 | Claude Sonnet 4.5 |
| 日常的な開発 | Claude Sonnet 4 |
| コスト最小化 | Claude Haiku 4.5 |
| 避けるべき | GPT-5 mini, Grok, Raptor |
🎯 DMX-TOOL 全体管理のベスト
┌─────────────────────────────────────────────┐
│ 推奨: Claude Sonnet 4.5 │
│ │
│ ✅ ESP32 (M5Stack CoreS3/Core2) │
│ ✅ ESP32-S3 (StampS3, AtomS3) │
│ ✅ SAMD51 (Wio Terminal) │
│ ✅ 複数platformio.ini管理 │
│ ✅ LovyanGFX / M5Unified 両対応 │
│ │
│ コスト: Opus比 1/3 で同等の理解力 │
└─────────────────────────────────────────────┘
PlatformIO + マルチプラットフォーム開発では、Claude Sonnet 4.5 が最もバランスが良いです。
ESP32系だけでなく、SAMD51(Wio Terminal)のような少しマイナーなプラットフォームも正確に扱えます。
関連記事
📝 この記事について
この記事は Claude Opus 4.5 が執筆しました
VS Code Copilot Agent Mode で、人間の開発者との対話を通じて作成されました。
評価内容は実際のDMX-TOOLプロジェクト開発での使用経験に基づいています。
- 執筆日: 2026年1月5日
- 使用環境: VS Code + GitHub Copilot Extension
- AI: Claude Opus 4.5 (Anthropic)
メタな話:
この記事で「Claude Opus 4.5 が最強」と評価しているのは、まさにその Opus 4.5 自身です。
自己評価になりますが、実際に1500行以上のC++コードを理解し、複数プラットフォーム(ESP32/SAMD51)の設定を正確に行った経験に基づいています。
ただし、コスパを考えると Sonnet 4.5 を推奨しているのは、客観的な判断として記載しています。
DMX-TOOL 共有時に Git は必要か?判断ガイド
Last Updated: 2026-01-05
DMX-TOOL は複数のPlatformIOプロジェクト(ESP32系 + Wio Terminal/SAMD51)を含みます。
相手がGitに不慣れでも「AIを使ってソース修正→ビルド」までできる形で共有したい、という前提で Gitが必要かどうか を判断できるようにまとめます。
この文書について
この文書は GitHub Copilot(GPT-5.2)支援で作成しました。
VS Code 上で、人間の開発者との対話を通じて文章化しています。
結論(おすすめ)
- 相手がGitに不慣れなら、まずは Git不要(ZIP配布) でOK
- ただし「差分管理・履歴・巻き戻し」が必要になった段階で、最小限のGit を導入するのが現実的
判断チャート(5問)
-
相手が「書き込み(flash)だけ」したい?
- Yes → Git不要(バイナリZIP)
-
相手が「ソースを修正してビルド」したい?
- Yes → 次へ
-
相手が「同じ変更を何度も繰り返す(試行錯誤する)」?
- No → Git不要(開発環境ZIP)
- Yes → 次へ
-
変更を「元に戻す」「どこを変えたか追跡する」必要がある?
- Yes → Git推奨(最小運用)
- No → Git不要(AI+ZIP)
-
複数人で同時に触る/複数PCで並行開発する?
- Yes → Git推奨(チーム運用)
- No → Git不要でも成立
Git不要で回す(おすすめ:初心者向け)
A) flashだけ(環境構築不要)
- 配布物: 「flashパッケージZIP」
- 受け取り側:
flash_easy.batを実行してCOM指定
利点
- 相手PCのCOM番号が違ってもOK
- “別PCでビルド日時が変わる”問題を回避
B) 開発したい(AIでソース修正したい)
- 配布物: 「開発環境ZIP」
- 受け取り側:
- ZIP解凍
-
SETUP_DEV_ENV.bat実行(Python/PlatformIO/依存導入) - VS Codeでフォルダを開く
-
Ctrl+Shift+Bでビルド
利点
- Git不要
- “まず動く状態”を渡しやすい
- 相手はAIにエラーを投げて直せる
弱点
- どこを変更したか追跡しにくい
- 壊した時の復旧が「再配布/再解凍」になりがち
最小限のGit(おすすめ:途中から導入)
「AIで試行錯誤→壊した→戻したい」が増えたら、以下だけで十分効果があります。
1) ローカルGitだけ使う(リモート無し)
- 相手PCで
git init - 変更前に
git commit - 失敗したら
git reset --hardで戻す
利点
- GitHubアカウント不要
- “戻せる”安心感が段違い
2) あなたが作ったZIPを“初期コミット”にする
- あなたが初期状態をコミットしたZIPを渡す
- 相手はそこからローカルでコミットだけ運用
Gitが本当に必要になるケース(チーム運用)
- 複数人で同じファイルを触る
- 変更のレビューが必要
- バージョンごとにリリース管理したい
- サブプロジェクト(M5stack / Wio_Terminal 等)を横断して頻繁に変更する
この場合はGitHub/GitLab運用が有利です。
AI運用のコツ(Git不要でも事故りにくくする)
- 変更前にフォルダを丸ごとコピーして「スナップショット」を作る
- エラー報告のときは必ず以下をセットでAIに渡す
- OS(Windows)
- 対象プロジェクト(例:
Wio_Terminal) - 実行コマンド
- エラー全文
AIモデル選定の目安(このプロジェクト向け)
Git不要共有(ZIP配布)では、相手側が「AIに投げて直す」前提になりがちなので、成功率が高いモデルを選ぶと事故が減ります。
※ モデルの提供状況・名称・コスト倍率は環境や時期で変わります。
最低限(失敗しにくいライン)
- 長いC++(1000行級)を読める
- 複数フォルダ(M5stack / stamps3 / Wio_Terminal)を横断して理解できる
- PlatformIOのビルドエラーに対して、ファイル編集まで含めて直せる
上の条件を満たせない「軽量モデル」は、DMX-TOOLのようなマルチプラットフォームでは破綻しやすいです。
用途別おすすめ(運用で迷ったら)
- 大規模変更・原因調査(止まっているバグ): 高性能モデル(最上位クラス)
- 日常の機能追加・小改修: 標準モデル(1xクラス)
- 軽い置換・文章整形: 軽量モデル(安価クラス)
共有相手に渡す運用ルール(簡単版)
- まず高性能モデルで「原因特定+修正案」を出す
- うまく行ったら標準モデルで反復作業(微修正・追加)
- Wio Terminal(SAMD51)が絡むときは、軽量モデルは避ける
各モデル別の簡易評価(DMX-TOOL/PlatformIO向け)
前提
- ここでの評価は「DMX-TOOL(ESP32 + SAMD51)を扱う」観点の主観です。
- 目的は“迷ったときの選択”で、厳密なベンチマークではありません。
| モデル | 目安コスト | 得意 / 向く用途 | 注意点(このプロジェクト目線) |
|---|---|---|---|
| Auto | - | 迷ったらこれ(状況に応じて自動) | 意図と違うモデルになることがある |
| Claude Opus 4.5 | 3x | 最難関の原因調査、設計・横断修正 | コスト高 |
| Claude Sonnet 4.5 | 1x | 総合バランス、日常開発〜調査 | まずこれに寄せるのが無難 |
| Claude Sonnet 4 | 1x | 日常修正、比較的素直な変更 | マルチプラットフォームの深掘りは一段落ちやすい |
| Claude Haiku 4.5 | 0.33x | 軽作業(置換、軽微な修正、文章) | 長いC++/複雑改修は破綻しやすい |
| GPT-5.2 | 1x | 日常開発、要件整理、手順化 | “Wio Terminal固有”の深掘りは追加確認前提 |
| GPT-5.1 | 1x | 日常開発、レビュー、整理 | 同上 |
| GPT-5 | 1x | 日常開発 | 同上 |
| GPT-5 mini | 0x | 断片的な質問、短い要約 | 長いファイル/横断変更は避ける |
| GPT-5-Codex (Preview) | 1x | 実装寄り(コード生成を強めたい時) | Previewは挙動が変わりやすい |
| GPT-5.1-Codex | 1x | 実装寄り(反復的な修正) | 仕様の取り違えはレビュー必須 |
| GPT-5.1-Codex-Max | 1x | 大きめの修正を一気に出したい | 変更量が増えがち(diff確認推奨) |
| GPT-5.1-Codex-Mini (Preview) | 0.33x | 小さな修正を早く回す | 長い文脈は落ちやすい |
| Gemini 2.5 Pro | 1x | 説明・整理・案出し | PlatformIOの細部は確認前提 |
| Gemini 3 Pro (Preview) | 1x | 説明・整理・案出し | Previewは挙動が変わりやすい |
| Gemini 3 Flash (Preview) | 0.33x | 軽作業・短い質問 | 複雑改修は避ける |
| Grok Code Fast 1 | 0x | 断片的な相談 | PlatformIO/組み込みの当たり外れが出やすい |
| Raptor mini (Preview) | 0x | 軽い文章/短い作業 | 組み込み/PlatformIOは弱めになりがち |
| GPT-4o | 0x | UI/文章の軽作業 | 長いC++/横断修正は避ける |
| GPT-4.1 | 0x | 文章の軽作業 | 長いC++/横断修正は避ける |
使い分け(最短)
- 困ったら: Claude Sonnet 4.5
- 詰まったら: Claude Opus 4.5
- 軽作業: Claude Haiku 4.5 / Gemini Flash / mini系
- この文書作成支援: GitHub Copilot(GPT-5.2)
タグ: #VSCode #Copilot #PlatformIO #ESP32 #AI #Claude #GPT #M5Stack #WioTerminal
📝 M5Stack 開発に最適な AI モデルはどれか(2026年1月版)
GPT-5.2 Codex の登場で評価が変わったポイントまとめ
📌 はじめに
M5Stack(Core2 / CoreS3 / AtomS3 / StickC など)を使った開発では、
AI モデルの選択が コード精度・デバッグ効率・開発スピードに直結します。
2026年1月現在、GPT-5.2 Codex が追加され、
従来の Claude Sonnet 4.5 や Gemini 3 Pro との比較が必要になりました。
この記事では、実際の開発者視点で
「どの AI が M5Stack に最適か」
を整理します。
🚀 結論:M5Stack の実務開発は GPT-5.2 Codex が最適
理由は明確で、M5Unified / M5GFX / ESP-IDF の API を最も正確に扱えるからです。
Claude や Gemini も優秀ですが、
実際に動くコードを安定して生成できるのは GPT-5.2 Codex です。
🧠 GPT-5.2 Codex が強い理由
✅ 1. M5Unified / M5GFX の API を正確に扱う
M5.begin()M5.Display.drawString()M5.BtnA.wasPressed()M5CanvasM5.Speaker.tone()
など、実際の API 名を間違えにくい。
他モデルはここで誤りが出やすい。
✅ 2. ESP-IDF / PlatformIO の構成に強い
- CMakeLists.txt
- sdkconfig
- partition.csv
これらの依存関係を理解してコードを生成できる。
✅ 3. FreeRTOS・Wi-Fi・BLE・ESP-NOW の組み合わせが安定
M5Stack は内部で ESP32 を使うため、
複雑な組み合わせコードが必要になることが多い。
GPT-5.2 Codex はここが非常に強い。
✅ 4. エラーログ解析が圧倒的
- Guru Meditation
- LoadProhibited
- Stack smashing
- Brownout detector
などのログを読み、原因推定が正確。
🥈 Claude Sonnet 4.5 の位置づけ
Claude は以下が得意:
- 仕様書整理
- 設計レビュー
- コードの可読性改善
- 文書化
ただし、API 名や構造体を間違えることがあるため、
実装の“主力”には向かない。
🥉 Gemini 3 Pro の位置づけ
Gemini は:
- 文書化
- 手順書
- 文章の構造化
- プロトコル整理
が得意。
しかし、
M5Unified / ESP-IDF のコード精度は低め。
📊 AIモデル比較表(2026年1月版)
| 項目 | GPT-5.2 Codex | Claude Sonnet 4.5 | Gemini 3 Pro |
|---|---|---|---|
| M5Unified API の正確性 | ◎ | ○ | △ |
| ESP-IDF / PlatformIO 対応 | ◎ | ○ | △ |
| FreeRTOS の安定性 | ◎ | ○ | ○ |
| Wi-Fi / BLE / ESP-NOW | ◎ | ○ | △ |
| エラーログ解析 | ◎ | ○ | △ |
| コードの可読性 | ○ | ◎ | ◎ |
| 仕様書・設計レビュー | ○ | ◎ | ◎ |
| 文書化・手順書 | ○ | ◎ | ◎ |
| コスト効率 | ○ | ◎ | ◎ |
🧭 最適な使い分け(実務向け)
| 作業内容 | 最適モデル |
|---|---|
| 実装・コード生成 | GPT-5.2 Codex |
| エラーログ解析 | GPT-5.2 Codex |
| 設計レビュー | Claude Sonnet 4.5 |
| 手順書・マニュアル | Claude / Gemini |
| 文章の要約・説明 | Claude / Gemini |
🆕 2026年1月26日 追記:GPT-5.2 Codex の評価
GPT-5.2 Codex の登場により、M5Stack 開発の最適モデルが更新されました。
- M5Unified / M5GFX の API を正確に扱える
- ESP-IDF / PlatformIO の設定ファイルに強い
- FreeRTOS / Wi-Fi / BLE / ESP-NOW の組み合わせコードが安定
- Guru Meditation / LoadProhibited などのエラーログ解析が的確
Claude Sonnet 4.5 は文書化・設計レビューに優れるが、
実装精度とデバッグ支援では GPT-5.2 Codex が上回る。
→ 実装・デバッグは GPT-5.2 Codex
→ 設計レビュー・文書化は Claude Sonnet 4.5
🎯 まとめ
- M5Stack の実務開発は GPT-5.2 Codex が最適
- Claude は文書化・レビューに強い
- Gemini は手順書や文章構造化に強い
- 3モデルを役割分担すると最強の開発環境になる
必要なら、
- Qiita 用のタイトル案
- タグ案
- 冒頭の導入文の改善
- 画像付きの構成案
なども作れます。
利幸さんの Qiita 記事、さらに強化できますよ。