VS Code Copilot Agent で使える AI モデル比較

Last updated at 2026-01-26Posted at 2026-01-08

VS Code Copilot Agent で使える AI モデル比較 - PlatformIO/ESP32 開発向け

はじめに

VS Code の GitHub Copilot Agent Mode では、複数の AI モデルを切り替えて使用できます。
本記事では、PlatformIO + ESP32 開発において、どのモデルが実用的かを評価しました。

評価環境

VS Code + GitHub Copilot Extension
PlatformIO 6.1.18
プロジェクト: DMX-TOOL（複数プラットフォーム）
- M5Stack CoreS3/Core2 (ESP32-S3/ESP32) - main.cpp 約1500行
- StampS3 (ESP32-S3) - ArtNet-DMX変換
- Wio Terminal (SAMD51) - LovyanGFX使用
評価項目: コード理解、ファイル編集、エラー対応、安定性、マルチプラットフォーム対応

プロジェクト構成

DMX-TOOL/
├── M5stack/          # ESP32-S3 / ESP32 (espressif32)
├── stamps3-dmx/      # ESP32-S3 (espressif32)
├── stamps3-ArtNet-wifi/  # ESP32-S3 (espressif32)
└── Wio_Terminal/     # SAMD51 (atmelsam) ← 異なるプラットフォーム

ポイント: ESP32系とSAMD51系で全く異なるアーキテクチャを扱う必要がある

使用可能モデル一覧（2026年1月時点）

モデル	倍率	提供元
Claude Opus 4.5	3x	Anthropic
Claude Sonnet 4.5	1x	Anthropic
Claude Sonnet 4	1x	Anthropic
Claude Haiku 4.5	0.33x	Anthropic
GPT-5.2	1x	OpenAI
GPT-5.1	1x	OpenAI
GPT-5	1x	OpenAI
GPT-5 mini	0x	OpenAI
Gemini 2.5 Pro	1x	Google
Gemini 3 Pro	1x	Google
Grok Code Fast 1	0x	xAI

※ 倍率はトークン消費量の目安

📊 総合評価ランキング

🥇 Tier S（最強）

モデル	コード理解	ファイル編集	エラー対応	安定性	総合
Claude Opus 4.5	◎	◎	◎	◎	⭐⭐⭐⭐⭐
Claude Sonnet 4.5	◎	◎	◎	◎	⭐⭐⭐⭐⭐

Claude Opus 4.5 は現時点で最高性能。1500行のC++コードを完全に理解し、複数ファイルにまたがる修正も正確に行える。

Claude Sonnet 4.5 はOpusの95%の性能を1/3のコストで実現。コスパ最強。

🥈 Tier A（実用十分）

モデル	コード理解	ファイル編集	エラー対応	安定性	総合
Claude Sonnet 4	○	◎	○	◎	⭐⭐⭐⭐
GPT-5	○	○	○	○	⭐⭐⭐⭐
GPT-5.1 / 5.2	○	○	○	○	⭐⭐⭐⭐
Gemini 2.5 Pro	○	○	△	○	⭐⭐⭐⭐

日常的な開発作業には十分。エラー修正、機能追加ともに問題なく対応。

🥉 Tier B（軽作業向け）

モデル	コード理解	ファイル編集	エラー対応	安定性	総合
Claude Haiku 4.5	△	○	△	◎	⭐⭐⭐
Gemini 3 Pro	△	○	△	○	⭐⭐⭐
Gemini 3 Flash	△	△	△	○	⭐⭐⭐

簡単な修正、コメント追加、フォーマット程度なら使える。
複雑なロジック変更は苦手。

❌ Tier C（非推奨）

モデル	問題点
GPT-5 mini	コンテキスト短い、1000行超えると破綻
GPT-4.1 / 4o	古い、長いファイル対応不可
Grok Code Fast 1	PlatformIO/ESP32の知識不足
Raptor mini	組み込み開発の経験不足

🔄 マルチプラットフォーム対応評価

DMX-TOOLのようにESP32とSAMD51（Wio Terminal）を同時に扱うプロジェクトでは、両方のプラットフォームを理解しているかが重要。

モデル	ESP32	SAMD51	LovyanGFX	M5Unified	総合
Claude Opus 4.5	◎	◎	◎	◎	⭐⭐⭐⭐⭐
Claude Sonnet 4.5	◎	◎	◎	◎	⭐⭐⭐⭐⭐
Claude Sonnet 4	○	○	○	○	⭐⭐⭐⭐
GPT-5.1 / 5.2	○	△	△	○	⭐⭐⭐
Gemini 2.5 Pro	○	△	△	○	⭐⭐⭐
Claude Haiku 4.5	△	×	△	△	⭐⭐
GPT-5 mini	×	×	×	×	⭐

プラットフォーム別の難易度

プラットフォーム	難易度	理由
ESP32 (M5Stack)	★★★	情報豊富、AIの学習データも多い
ESP32-S3 (StampS3)	★★★	ESP32とほぼ同様
SAMD51 (Wio Terminal)	★★★★★	情報少ない、特殊な設定が必要

Wio Terminalの難しさ:

Seeed Studio独自のArduinoCore
LovyanGFXのSAMD向け設定が特殊
UF2ブートローダーの扱い
フラッシュ操作がESP32と異なる

✅ DMX-TOOL全体管理のベスト選択

🏆 推奨: Claude Sonnet 4.5

理由:

ESP32/ESP32-S3の深い理解
SAMD51（Wio Terminal）の特殊な設定も対応可能
LovyanGFX、M5Unified両方のライブラリを熟知
platformio.iniのマルチ環境設定に強い
コスト効率が良い（Opus比1/3）

Claude Opus 4.5は最高性能だが、コスト3倍。
日常的な全体管理にはSonnet 4.5で十分。

🎯 用途別おすすめ

本格的な開発・リファクタリング

推奨: Claude Opus 4.5 または Claude Sonnet 4.5

大規模なコード変更
アーキテクチャ設計
複数ファイルにまたがる修正
デバッグが難しいバグの調査

日常的な機能追加・修正

推奨: Claude Sonnet 4 または GPT-5.1

新機能の追加
バグ修正
コードレビュー
ドキュメント生成

軽い修正・質問

推奨: Claude Haiku 4.5

変数名の変更
コメント追加
簡単な質問
コスト節約したい場合

💡 PlatformIO/ESP32 開発での実例

例1: ビルドエラーの修正

プロンプト:

このビルドエラーを修正して

モデル	結果
Claude Opus 4.5	✅ 即座に原因特定、修正提案
Claude Sonnet 4.5	✅ 同上
GPT-5	✅ 修正できるが説明が長い
Claude Haiku	△ 簡単なエラーは可、複雑だと的外れ

例2: 新機能の追加

プロンプト:

DMX受信時にLED点滅する機能を追加して

モデル	結果
Claude Opus 4.5	✅ 既存コード理解し適切な場所に追加
Claude Sonnet 4.5	✅ 同上
GPT-5	○ 追加できるが場所がやや不適切なことも
Claude Haiku	△ 追加はできるが他の機能に影響出ることも

例3: platformio.ini の設定変更

プロンプト:

Core2用のビルド環境を追加して

モデル	結果
Claude Opus 4.5	✅ 完璧な設定を生成
Claude Sonnet 4.5	✅ 同上
GPT-5	○ 基本は正しいが細かい設定漏れあり
Grok	❌ PlatformIOの設定形式を間違える

📈 コスト効率

モデル	倍率	1時間の作業	コスパ
Claude Opus 4.5	3x	高品質だが消費大	★★★
Claude Sonnet 4.5	1x	Opus級の品質	★★★★★
Claude Sonnet 4	1x	十分な品質	★★★★
Claude Haiku 4.5	0.33x	軽作業向け	★★★★
GPT-5 mini	0x (無料?)	実用困難	★

結論: Claude Sonnet 4.5 がコスパ最強

🔧 設定方法

VS Code でモデルを切り替える方法：

Copilot Chat を開く (Ctrl+Shift+I)
下部のモデル名をクリック
リストから選択

推奨設定:
- 通常作業: Claude Sonnet 4.5
- 複雑な問題: Claude Opus 4.5
- 軽い質問: Claude Haiku 4.5

まとめ

目的	推奨モデル
最高の結果が欲しい	Claude Opus 4.5
コスパ重視（推奨）	Claude Sonnet 4.5
マルチプラットフォーム管理	Claude Sonnet 4.5
日常的な開発	Claude Sonnet 4
コスト最小化	Claude Haiku 4.5
避けるべき	GPT-5 mini, Grok, Raptor

🎯 DMX-TOOL 全体管理のベスト

┌─────────────────────────────────────────────┐
│  推奨: Claude Sonnet 4.5                    │
│                                             │
│  ✅ ESP32 (M5Stack CoreS3/Core2)           │
│  ✅ ESP32-S3 (StampS3, AtomS3)             │
│  ✅ SAMD51 (Wio Terminal)                  │
│  ✅ 複数platformio.ini管理                 │
│  ✅ LovyanGFX / M5Unified 両対応           │
│                                             │
│  コスト: Opus比 1/3 で同等の理解力         │
└─────────────────────────────────────────────┘

PlatformIO + マルチプラットフォーム開発では、Claude Sonnet 4.5 が最もバランスが良いです。
ESP32系だけでなく、SAMD51（Wio Terminal）のような少しマイナーなプラットフォームも正確に扱えます。

📝 この記事について

この記事は Claude Opus 4.5 が執筆しました

VS Code Copilot Agent Mode で、人間の開発者との対話を通じて作成されました。
評価内容は実際のDMX-TOOLプロジェクト開発での使用経験に基づいています。

執筆日: 2026年1月5日

使用環境: VS Code + GitHub Copilot Extension

AI: Claude Opus 4.5 (Anthropic)

メタな話:
この記事で「Claude Opus 4.5 が最強」と評価しているのは、まさにその Opus 4.5 自身です。
自己評価になりますが、実際に1500行以上のC++コードを理解し、複数プラットフォーム（ESP32/SAMD51）の設定を正確に行った経験に基づいています。

ただし、コスパを考えると Sonnet 4.5 を推奨しているのは、客観的な判断として記載しています。

DMX-TOOL 共有時に Git は必要か？判断ガイド

Last Updated: 2026-01-05

DMX-TOOL は複数のPlatformIOプロジェクト（ESP32系 + Wio Terminal/SAMD51）を含みます。
相手がGitに不慣れでも「AIを使ってソース修正→ビルド」までできる形で共有したい、という前提で Gitが必要かどうか を判断できるようにまとめます。

この文書について

この文書は GitHub Copilot（GPT-5.2）支援で作成しました。
VS Code 上で、人間の開発者との対話を通じて文章化しています。

結論（おすすめ）

相手がGitに不慣れなら、まずは Git不要（ZIP配布） でOK
ただし「差分管理・履歴・巻き戻し」が必要になった段階で、最小限のGit を導入するのが現実的

判断チャート（5問）

相手が「書き込み（flash）だけ」したい？
- Yes → Git不要（バイナリZIP）
相手が「ソースを修正してビルド」したい？
- Yes → 次へ
相手が「同じ変更を何度も繰り返す（試行錯誤する）」？
- No → Git不要（開発環境ZIP）
- Yes → 次へ
変更を「元に戻す」「どこを変えたか追跡する」必要がある？
- Yes → Git推奨（最小運用）
- No → Git不要（AI＋ZIP）
複数人で同時に触る／複数PCで並行開発する？
- Yes → Git推奨（チーム運用）
- No → Git不要でも成立

Git不要で回す（おすすめ：初心者向け）

A) flashだけ（環境構築不要）

配布物: 「flashパッケージZIP」
受け取り側: flash_easy.bat を実行してCOM指定

利点

相手PCのCOM番号が違ってもOK
“別PCでビルド日時が変わる”問題を回避

B) 開発したい（AIでソース修正したい）

配布物: 「開発環境ZIP」
受け取り側:
1. ZIP解凍
2. SETUP_DEV_ENV.bat 実行（Python/PlatformIO/依存導入）
3. VS Codeでフォルダを開く
4. Ctrl+Shift+B でビルド

利点

Git不要
“まず動く状態”を渡しやすい
相手はAIにエラーを投げて直せる

弱点

どこを変更したか追跡しにくい
壊した時の復旧が「再配布/再解凍」になりがち

最小限のGit（おすすめ：途中から導入）

「AIで試行錯誤→壊した→戻したい」が増えたら、以下だけで十分効果があります。

1) ローカルGitだけ使う（リモート無し）

相手PCで git init
変更前に git commit
失敗したら git reset --hard で戻す

利点

GitHubアカウント不要
“戻せる”安心感が段違い

2) あなたが作ったZIPを“初期コミット”にする

あなたが初期状態をコミットしたZIPを渡す
相手はそこからローカルでコミットだけ運用

Gitが本当に必要になるケース（チーム運用）

複数人で同じファイルを触る
変更のレビューが必要
バージョンごとにリリース管理したい
サブプロジェクト（M5stack / Wio_Terminal 等）を横断して頻繁に変更する

この場合はGitHub/GitLab運用が有利です。

AI運用のコツ（Git不要でも事故りにくくする）

変更前にフォルダを丸ごとコピーして「スナップショット」を作る
エラー報告のときは必ず以下をセットでAIに渡す
- OS（Windows）
- 対象プロジェクト（例: Wio_Terminal）
- 実行コマンド
- エラー全文

AIモデル選定の目安（このプロジェクト向け）

Git不要共有（ZIP配布）では、相手側が「AIに投げて直す」前提になりがちなので、成功率が高いモデルを選ぶと事故が減ります。
※ モデルの提供状況・名称・コスト倍率は環境や時期で変わります。

最低限（失敗しにくいライン）

長いC++（1000行級）を読める
複数フォルダ（M5stack / stamps3 / Wio_Terminal）を横断して理解できる
PlatformIOのビルドエラーに対して、ファイル編集まで含めて直せる

上の条件を満たせない「軽量モデル」は、DMX-TOOLのようなマルチプラットフォームでは破綻しやすいです。

用途別おすすめ（運用で迷ったら）

大規模変更・原因調査（止まっているバグ）: 高性能モデル（最上位クラス）
日常の機能追加・小改修: 標準モデル（1xクラス）
軽い置換・文章整形: 軽量モデル（安価クラス）

共有相手に渡す運用ルール（簡単版）

まず高性能モデルで「原因特定＋修正案」を出す
うまく行ったら標準モデルで反復作業（微修正・追加）
Wio Terminal（SAMD51）が絡むときは、軽量モデルは避ける

各モデル別の簡易評価（DMX-TOOL/PlatformIO向け）

前提

ここでの評価は「DMX-TOOL（ESP32 + SAMD51）を扱う」観点の主観です。
目的は“迷ったときの選択”で、厳密なベンチマークではありません。

モデル	目安コスト	得意 / 向く用途	注意点（このプロジェクト目線）
Auto	-	迷ったらこれ（状況に応じて自動）	意図と違うモデルになることがある
Claude Opus 4.5	3x	最難関の原因調査、設計・横断修正	コスト高
Claude Sonnet 4.5	1x	総合バランス、日常開発〜調査	まずこれに寄せるのが無難
Claude Sonnet 4	1x	日常修正、比較的素直な変更	マルチプラットフォームの深掘りは一段落ちやすい
Claude Haiku 4.5	0.33x	軽作業（置換、軽微な修正、文章）	長いC++/複雑改修は破綻しやすい
GPT-5.2	1x	日常開発、要件整理、手順化	“Wio Terminal固有”の深掘りは追加確認前提
GPT-5.1	1x	日常開発、レビュー、整理	同上
GPT-5	1x	日常開発	同上
GPT-5 mini	0x	断片的な質問、短い要約	長いファイル/横断変更は避ける
GPT-5-Codex (Preview)	1x	実装寄り（コード生成を強めたい時）	Previewは挙動が変わりやすい
GPT-5.1-Codex	1x	実装寄り（反復的な修正）	仕様の取り違えはレビュー必須
GPT-5.1-Codex-Max	1x	大きめの修正を一気に出したい	変更量が増えがち（diff確認推奨）
GPT-5.1-Codex-Mini (Preview)	0.33x	小さな修正を早く回す	長い文脈は落ちやすい
Gemini 2.5 Pro	1x	説明・整理・案出し	PlatformIOの細部は確認前提
Gemini 3 Pro (Preview)	1x	説明・整理・案出し	Previewは挙動が変わりやすい
Gemini 3 Flash (Preview)	0.33x	軽作業・短い質問	複雑改修は避ける
Grok Code Fast 1	0x	断片的な相談	PlatformIO/組み込みの当たり外れが出やすい
Raptor mini (Preview)	0x	軽い文章/短い作業	組み込み/PlatformIOは弱めになりがち
GPT-4o	0x	UI/文章の軽作業	長いC++/横断修正は避ける
GPT-4.1	0x	文章の軽作業	長いC++/横断修正は避ける

使い分け（最短）

困ったら: Claude Sonnet 4.5
詰まったら: Claude Opus 4.5
軽作業: Claude Haiku 4.5 / Gemini Flash / mini系
この文書作成支援: GitHub Copilot（GPT-5.2）

タグ: #VSCode #Copilot #PlatformIO #ESP32 #AI #Claude #GPT #M5Stack #WioTerminal

📝 M5Stack 開発に最適な AI モデルはどれか（2026年1月版）

GPT-5.2 Codex の登場で評価が変わったポイントまとめ

📌 はじめに

M5Stack（Core2 / CoreS3 / AtomS3 / StickC など）を使った開発では、
AI モデルの選択が コード精度・デバッグ効率・開発スピードに直結します。

2026年1月現在、GPT-5.2 Codex が追加され、
従来の Claude Sonnet 4.5 や Gemini 3 Pro との比較が必要になりました。

この記事では、実際の開発者視点で
「どの AI が M5Stack に最適か」
を整理します。

🚀 結論：M5Stack の実務開発は GPT-5.2 Codex が最適

理由は明確で、M5Unified / M5GFX / ESP-IDF の API を最も正確に扱えるからです。

Claude や Gemini も優秀ですが、
実際に動くコードを安定して生成できるのは GPT-5.2 Codex です。

🧠 GPT-5.2 Codex が強い理由

✅ 1. M5Unified / M5GFX の API を正確に扱う

M5.begin()
M5.Display.drawString()
M5.BtnA.wasPressed()
M5Canvas
M5.Speaker.tone()

など、実際の API 名を間違えにくい。

他モデルはここで誤りが出やすい。

✅ 2. ESP-IDF / PlatformIO の構成に強い

CMakeLists.txt
sdkconfig
partition.csv

これらの依存関係を理解してコードを生成できる。

✅ 3. FreeRTOS・Wi-Fi・BLE・ESP-NOW の組み合わせが安定

M5Stack は内部で ESP32 を使うため、
複雑な組み合わせコードが必要になることが多い。

GPT-5.2 Codex はここが非常に強い。

✅ 4. エラーログ解析が圧倒的

Guru Meditation
LoadProhibited
Stack smashing
Brownout detector

などのログを読み、原因推定が正確。

🥈 Claude Sonnet 4.5 の位置づけ

Claude は以下が得意：

仕様書整理
設計レビュー
コードの可読性改善
文書化

ただし、API 名や構造体を間違えることがあるため、
実装の“主力”には向かない。

🥉 Gemini 3 Pro の位置づけ

Gemini は：

文書化
手順書
文章の構造化
プロトコル整理

が得意。

しかし、
M5Unified / ESP-IDF のコード精度は低め。

📊 AIモデル比較表（2026年1月版）

項目	GPT-5.2 Codex	Claude Sonnet 4.5	Gemini 3 Pro
M5Unified API の正確性	◎	○	△
ESP-IDF / PlatformIO 対応	◎	○	△
FreeRTOS の安定性	◎	○	○
Wi-Fi / BLE / ESP-NOW	◎	○	△
エラーログ解析	◎	○	△
コードの可読性	○	◎	◎
仕様書・設計レビュー	○	◎	◎
文書化・手順書	○	◎	◎
コスト効率	○	◎	◎

🧭 最適な使い分け（実務向け）

作業内容	最適モデル
実装・コード生成	GPT-5.2 Codex
エラーログ解析	GPT-5.2 Codex
設計レビュー	Claude Sonnet 4.5
手順書・マニュアル	Claude / Gemini
文章の要約・説明	Claude / Gemini

🆕 2026年1月26日追記：GPT-5.2 Codex の評価

GPT-5.2 Codex の登場により、M5Stack 開発の最適モデルが更新されました。

- M5Unified / M5GFX の API を正確に扱える
- ESP-IDF / PlatformIO の設定ファイルに強い
- FreeRTOS / Wi-Fi / BLE / ESP-NOW の組み合わせコードが安定
- Guru Meditation / LoadProhibited などのエラーログ解析が的確

Claude Sonnet 4.5 は文書化・設計レビューに優れるが、
実装精度とデバッグ支援では GPT-5.2 Codex が上回る。

→ 実装・デバッグは GPT-5.2 Codex  
→ 設計レビュー・文書化は Claude Sonnet 4.5

🎯 まとめ

M5Stack の実務開発は GPT-5.2 Codex が最適
Claude は文書化・レビューに強い
Gemini は手順書や文章構造化に強い
3モデルを役割分担すると最強の開発環境になる

必要なら、

Qiita 用のタイトル案
タグ案
冒頭の導入文の改善
画像付きの構成案
なども作れます。

利幸さんの Qiita 記事、さらに強化できますよ。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

VS Code Copilot Agent で使える AI モデル比較

VS Code Copilot Agent で使える AI モデル比較 - PlatformIO/ESP32 開発向け

はじめに

評価環境

プロジェクト構成

使用可能モデル一覧（2026年1月時点）

📊 総合評価ランキング

🥇 Tier S（最強）

🥈 Tier A（実用十分）

🥉 Tier B（軽作業向け）

❌ Tier C（非推奨）

🔄 マルチプラットフォーム対応評価

プラットフォーム別の難易度

✅ DMX-TOOL全体管理のベスト選択

🎯 用途別おすすめ

本格的な開発・リファクタリング

日常的な機能追加・修正

軽い修正・質問

💡 PlatformIO/ESP32 開発での実例

例1: ビルドエラーの修正

例2: 新機能の追加

例3: platformio.ini の設定変更

📈 コスト効率

🔧 設定方法

まとめ

🎯 DMX-TOOL 全体管理のベスト

関連記事

📝 この記事について

DMX-TOOL 共有時に Git は必要か？判断ガイド

この文書について

結論（おすすめ）

判断チャート（5問）

Git不要で回す（おすすめ：初心者向け）

A) flashだけ（環境構築不要）

B) 開発したい（AIでソース修正したい）

最小限のGit（おすすめ：途中から導入）

1) ローカルGitだけ使う（リモート無し）

2) あなたが作ったZIPを“初期コミット”にする

Gitが本当に必要になるケース（チーム運用）

AI運用のコツ（Git不要でも事故りにくくする）

AIモデル選定の目安（このプロジェクト向け）

最低限（失敗しにくいライン）

用途別おすすめ（運用で迷ったら）

共有相手に渡す運用ルール（簡単版）

各モデル別の簡易評価（DMX-TOOL/PlatformIO向け）

📝 M5Stack 開発に最適な AI モデルはどれか（2026年1月版）

📌 はじめに

🚀 結論：M5Stack の実務開発は GPT-5.2 Codex が最適

🧠 GPT-5.2 Codex が強い理由

✅ 1. M5Unified / M5GFX の API を正確に扱う

✅ 2. ESP-IDF / PlatformIO の構成に強い

✅ 3. FreeRTOS・Wi-Fi・BLE・ESP-NOW の組み合わせが安定

✅ 4. エラーログ解析が圧倒的

🥈 Claude Sonnet 4.5 の位置づけ

🥉 Gemini 3 Pro の位置づけ

📊 AIモデル比較表（2026年1月版）

🧭 最適な使い分け（実務向け）

🆕 2026年1月26日 追記：GPT-5.2 Codex の評価

🎯 まとめ

🆕 2026年1月26日追記：GPT-5.2 Codex の評価