本日も、ネットに流れるトピックから個人的に興味を引かれたものを拾っていきます。
アルトマンが上げた「レッドアラート」の結果、GPT-5.2が登場しました。Gemini3との競走にこれで打ち勝つことはできるのでしょうか。ただ、ベンチマークは良くても実際の使い心地の問題が大きく、問題はユーザー体験の方に移りつつあるように思います。
この記事への感想等コメントで頂けるとありがたいです。
プログラミング
Visual Studio Code
VS Code 1.107 では、GitHub Copilot を核にした「Agent HQ」が追加され、ローカル・バックグラウンド・クラウド・カスタムエージェントを統合的に管理し、Git worktree を用いた並行タスク実行や組織共有エージェント、Claude Skills 再利用など高度なエージェント機能が強化されています。 また、チャットはセッション統合、モデル管理エディタ、URL/ドメインの二段階承認、動的コンテンツ対応の fetch、ターミナル出力のリッチ表示やコマンド自動承認などにより、セキュアかつ効率的な対話体験に刷新されています。 エディタ周りではインラインチャットのコード編集特化、TypeScript のリネーム提案や次編集モデル改善、ホバー挙動の細かな制御、macOS の 3 本指スワイプによるナビゲーション、Git スタッシュ表示など開発体験を底上げする変更が多数含まれます。 さらに、最新 MCP 仕様対応や GitHub MCP Server 統合、Azure モデルの Entra ID デフォルト認証、企業向けのツール自動承認制御やエージェント利用ポリシーなど、エンタープライズと拡張シナリオへの対応も進んでいます。
VS Codeのエージェントは、プロジェクト全体を理解して複数ファイルの編集やコマンド実行まで自動で行うAIで、ローカル・バックグラウンド・クラウド・サードパーティの4種類があります。 チャットビューからセッションの作成・切り替え・委譲(ローカル→バックグラウンド→クラウドなど)ができ、セッションごとの変更差分をレビューしてローカルへ適用したり、PRブランチとしてチェックアウトできます。
Go言語
gophrqlは、モダンなパイプライン型クエリ言語PRQLをGoだけで実装し、複数のSQL方言向けにコンパイルできるライブラリです。
プロジェクト概要
- PRQLをGoで実装し、PostgreSQLやMySQL、DuckDBなど主要なRDB向けのSQLに変換可能です。
- パイプライン記法や変数・関数、日付リテラル、文字列補間などPRQLの言語仕様を広くサポートしています。
特徴と用途
- 型安全なコンパイルとAST公開により、MongoDBなど非SQL向けの独自バックエンドも実装できます。
- 集約、JOIN、ウィンドウ関数、時系列分析など高度な分析クエリを簡潔に記述するサンプルが用意されています。
Bill One/Contract One の認証基盤に TOTP 向けリカバリーコード機能を Go で内製実装した際の検討内容をまとめた記事です。 NIST SP 800-63B と OWASP Cheat Sheet を基に、64bit 以上のエントロピーを持つコード生成(crypto/rand による CSPRNG、36 種類×24 桁)、Argon2id+PHC String Format でのハッシュ保存、スロットリングや ConstantTimeCompare による検証・タイミング攻撃対策などの要件と実装方針を整理しています。
C/C++
この記事は、C言語におけるポインター記法の問題点を指摘し、C23で導入されたtypeof演算子を用いて可読性を改善するアイデアを紹介している。 従来の*による宣言が複数変数や関数ポインターで直感的でないことを示し、typeofとPtr(T)マクロで「型名としてのポインター型」を表す新しい書き方を提案するが、実用性は限定的で、「複雑な型を扱う際にtypeofを使うと読みやすくできる」という知識として覚えておく価値があるとまとめている。
.NET
Rider / ReSharper 2025.3.0.4 は、AI Chat のマルチエージェント対応や AI クレジット管理機能の追加、ゲームエンジン向けクラウド補完強化などの新機能に加え、.NET 6 メモリ使用量や WSL・Android デプロイ・テスト出力表示など多数の不具合修正を含む重要なメンテナンスリリースです。
この記事は、.NET 10.0.1 や .NET Framework の更新、Visual Studio 2026 18.1.0 のリリース内容と .NET 10 のネットワーク機能改善を中心に、.NET / VS / Azure SDK など主要ライブラリのアップデートと、パフォーマンス・ネットワーク・ツール活用に関する技術記事や登壇資料へのリンクを整理した週次まとめです。
RDBMS
本記事は、MySQLのEXPLAINを用いてSQLの実行計画を読み解き、クエリが速くなる・遅くなる理由をインデックスの有無や種類の違いから解説している。
InnoDB+B+Treeを前提に、EXPLAINの各フィールド(type, key, rows, Extraなど)の意味を説明し、インデックスなしのフルスキャンとインデックスありの検索性能差を具体例で示している。
さらに、カバリングインデックスや複合インデックスによりルックアップを減らしてテーブルアクセスを最小化する方法を紹介し、実行計画を見ながらSQLチューニングの考え方を整理している。
Excel
Copilot in Excelを使うと、数式の構文や関数名を覚えていなくても、自然言語で「利益を合計して」などと入力するだけで適切な数式を自動生成できる。既存の数式の修正やシートをまたぐ参照、日付から四半期の算出などにも対応し、現在はExcel for the WebのMicrosoft 365 Copilotライセンスユーザー向けに、一度に1つの数式(または列/範囲)のみサポートして提供されている。
Aspire
Aspire の「統合」は、データベースやメッセージング、ストレージ、監視、AI など外部サービスとの接続を一貫したモデルで定義し、ローカル開発から本番デプロイまでの設定・接続文字列・環境変数・認証・テレメトリ設定を自動化する仕組みです。[1]
ホスティング統合がコンテナ起動や接続情報の生成、環境変数発行などインフラ側を用意し、クライアント統合が型付きクライアントやリトライ・ログ・トレース設定を含めてアプリ側を自動構成することで、接続文字列の差異吸収や設定ファイルの手書きを不要にし、多言語・多環境での開発やデプロイを大幅に簡素化します。[1]
GitHUb
GitHub Actions は急増する利用に対応するためバックエンドを再設計し、日次 7,100 万ジョブを処理できる新アーキテクチャで信頼性と性能を向上させました。
その上で YAML アンカー、非公開テンプレート、再利用ワークフローの拡張、キャッシュ上限撤廃、dispatch 入力増加、arm64 ランナーや新 OS イメージなど開発体験を改善する機能を追加し、2026 年前半にはタイムゾーン対応や parallel steps なども提供予定で、コミュニティからのフィードバックを募っています。
GitHubは2025年11月に3件のインシデントでサービス性能の低下を経験した。
11月17日はDependabotがGHCRのレート制限にかかり約57%のジョブがSLO未達となり、レート制限緩和と監視強化が行われた。
11月18日は内部サービス間通信のTLS証明書期限切れによりGit操作全般が失敗し、証明書更新と再起動、証明書管理の自動化強化が進められている。
11月28日はCopilotのClaude Sonnet 4.5モデルが誤設定で利用不可となり、設定差し戻しで復旧し、今後はデプロイの安全策を改善するとしている。
GitHubに新しく「リポジトリ ダッシュボード」のプレビュー機能が追加され、アクセス可能なリポジトリを横断的に検索・フィルタ・保存済みクエリで一覧管理できるようになった。 relevanceベースの並び替えや「My contributions」などのビュー、カスタムプロパティによる検索にも対応するが、関連度判定は直近1年の活動に限定されるなどの制約もある。
技術的負債
本記事は、技術的負債に伴い静かに蓄積する「クラフト」を、混在・分散・冗長・欠落の4種類に分類し、それぞれがメンテナンスコストを増大させるメカニズムと対処法を、具体的なコード例やケーススタディで示している。 また、クラフトは自然には減らないため、計画的なリファクタリングとADRによる意思決定の記録を組み合わせ、「作るフェーズ」と「整えるフェーズ」を循環させることで、スピードと品質を両立しつつ継続的に改善していく重要性を説いている。
認証・認可
本記事は、OpenID Connect Core 1.0で定義されるClaimsパラメーターの概要と、その具体的な活用方法を解説し、最後にメルカリでの利用例を紹介している。ClaimsパラメーターはAuthentication Requestで指定可能なJSONオブジェクトで、userinfo や id_token 配下に、essential や value・values を用いて必須属性や期待する値を細かく指定でき、scope だけでは表現しにくい属性条件付きの要求を実現可能とする。一方で、明示的な null 指定や各メンバーのデフォルト挙動など仕様上の要件が多く、IdP実装側ではパースや条件解釈が複雑になり得るため、まずはClaims以外のシンプルな手段で代替できないか検討した方がよい点も指摘している。メルカリでは、RFC 9470ベースのLoAに応じたStep Up認証と組み合わせ、保護リソース側が電話番号など特定の検証済み属性を求めるケースで、Claimsパラメーターにより一度のAuthorization Requestの中で属性登録・更新を誘導するユースケースを紹介している。
本
本書は、オンラインサービスに必須となるデジタルアイデンティティとID管理の基礎を、アイデンティティライフサイクルの視点から体系的に解説する入門書です。
身元確認・当人認証・ID連携・アクセス制御・セッション管理といった要素を押さえつつ、新規登録から退会までの一連のサイクルとして認証・認可機能を設計する考え方を示し、セキュリティとUXの両立を目指します。
難しい数式や暗号の詳細には立ち入らず、新人エンジニアや個人開発者でも理解しやすい説明で、安全で使いやすいID管理システム構築の基礎知識を身につけられる内容です。
開発手法
ウォンテッドリーのバックエンドチームで、コードレビューの待ち時間(平均1.42日→0.6日)が、『Tidy First?』の考え方を取り入れたプルリク分割によって大きく短縮された事例を紹介している。具体的には、「整頓(構造変更)」と「振る舞いを変える変更」を別プルリクに分け、さらに変更種類ごとに小さく分解して焦点を絞ることで、レビュアーの理解負荷と心理的ハードルを下げ、レビューが1日以内に終わるケースを増やしたと説明している。
エージェンティックコーディング・仕様駆動開発
DeNAの新卒研修で開発されたAIエディタ「EDEN」は、GitHub連携とLLMを活用して技術ブログ執筆のプロセスを自動化し、アウトライン生成からドラフト作成、タイトル・タグ付けまでを支援することで、執筆時間を従来の約3分の1に短縮しつつ記事品質の維持・向上を実現した社内向け執筆支援ツールです。
この記事は、「質とスピードはトレードオフ」という通念を、Agentic Codingの登場を踏まえて再検討している。 ペアプロは欠陥削減によりライフサイクル全体の速度を高める一方、現状のAgentic Codingは生成速度は速いがコード品質が十分でなく、そのままではペアプロの教訓と逆行すると指摘する。 また、事前設計や一括レビューで品質を担保しようとするアプローチには限界があり、TDDのような「設計を分割し創発させる」知見を踏まえたAgentic Coding向けの新しい手法やガードレール設計が重要だと論じている。
AI
OpenAI
Introducing GPT-5.2
GPT‑5.2は、専門的なナレッジワークや長時間動作するエージェント向けに設計された最新の最上位モデルで、スプレッドシートやプレゼン作成、コーディング、画像理解、長文コンテキスト処理、ツール呼び出しなどでGPT‑5.1を大きく上回る性能を示します。 GDPvalやSWE‑Bench Pro、FrontierMath、ARC‑AGIなど多くのベンチマークで新たなSOTAを達成し、人間の専門家レベルのタスク遂行能力と長コンテキストでの高精度な推論を備えています。 ChatGPTでは「Instant」「Thinking」「Pro」の3バリアントとして有料プランから順次提供され、APIではgpt-5.2やgpt-5.2-chat-latestなどとして利用可能で、価格は入力100万トークンあたり1.75ドル、出力14ドルに設定されています。 また、事実性や安全性、メンタルヘルス関連の応答品質も強化されており、企業利用や科学・数学研究など高信頼が求められる用途に適したモデルとなっています。
Advancing science and math with GPT-5.2
GPT‑5.2は数学・科学分野を強化した最新モデルで、GPQA DiamondやFrontierMathといったベンチマークで最高水準の精度を達成し、抽象的な数理推論や長い思考過程での一貫した論理展開を可能にしている。 論文では、統計的学習理論における学習曲線の単調性という未解決問題に対し、GPT‑5.2 Proが直接証明案を生成し、人間研究者と外部専門家が検証することで、正規分布に基づく基本的な設定ではデータを増やすほど性能が向上することを示したケーススタディが紹介されている。 この事例から、GPT‑5.2のようなモデルは、数学や理論計算機科学のような公理的分野で、証明探索や仮説検証を大きく加速しうる一方、信頼できる科学的進歩には依然として専門家による検証と透明性を重視した協働ワークフローが不可欠であると述べられている。
Ten years
OpenAI がこの10年を振り返り、少人数のスタートアップから世界規模のAI企業へ成長しつつ、AGIを「人類全体の利益のために」実現するという使命への手応えと強い楽観を語る文章です。 安全性と反復的な公開戦略を軸に、ChatGPT や GPT‑4 などの技術を社会に展開してきた経緯と成果、今後10年で超知能に到達しうるという見通し、人々と顧客への感謝が強調されています。
Googleは、AnthropicのModel Context Protocol(MCP)に公式対応したリモートMCPサーバーを提供し、GoogleおよびGoogle Cloud各種サービスをAIエージェントから統一的に利用可能にしました。 まずGoogle Maps、BigQuery、GCE、GKEから対応を開始し、ApigeeやCloud API Registryと連携して企業独自やサードパーティAPIも安全かつガバナンスされたツールとしてエージェントに公開できるようにします。 また、IAMや監査ログ、Model Armorによるセキュリティも統合し、今後Cloud RunやCloud Storage、各種データベースなどへの対応拡大も予定されています。
GoogleはAIとアーティストの10年以上にわたる協働を記念し、新たな展覧会「Gradient Canvas」を発表した。 ベイエリアの生態系に着想を得た世界各地のアーティスト13組が、GoogleのAIツールを用いて人と自然と機械の関係や知性のあり方を探求する作品を制作し、マウンテンビューのオフィスでの展示とGoogle Arts & Culture上で公開される。
Google Beamは、3D映像とAIを活用して遠隔コミュニケーションを対面に近い体験にするプラットフォームで、2025年にはI/Oでのお披露目、HPやZoomとの提携、BainやSalesforceなど企業での試験導入、米USOとのパイロットプログラム開始など、実用化とパートナー拡大が大きく進展したことが紹介されている。
App OrchidのData AgentとGoogleのPrediction AgentをA2A ProtocolとADKで連携させ、GeminiやTimesFM等の基盤モデルを用いて高精度な需要・売上予測を行うマルチエージェント型の業務予測システムの構築方法を紹介している。 この仕組みにより、複数エージェントをオーケストレータが統合し、企業データの統合・前処理から予測実行までを自動化して、在庫最適化やコスト削減、意思決定の高速化を実現できる点が強調されている。
AIエージェント時代には推論処理がAIワークロードの中心となり、高価なアクセラレータがデータやネットワーク、ストレージのボトルネックで遊んでしまう「AI効率ギャップ」がTCO危機を招いている。 このギャップは複数フレームワークやハードウェアが混在した断片的スタックとデータ品質・管理・前処理の課題が原因で、GPUアイドルやコスト増大、レイテンシ悪化を引き起こすため、汎用計算とアクセラレータ、ストレージ、ネットワークを統合設計したシステムレベル最適化が重要だと指摘している。
この記事は、Google のオープンモデル Gemma 3 を Google Cloud 本番環境にデプロイするためのハンズオンラボを紹介しており、サーバーレスな Cloud Run と、より高度なオーケストレーションが可能な GKE の2つのパスが用意されています。
Cloud Run パスでは vLLM と GPU を用いたシンプルでスケーラブルな推論 API 提供を、GKE パスでは Ollama でのローカル試作から GKE Autopilot への移行と Kubernetes マニフェストによる本番向けスケーラブル推論サービス構築を学べます。
Gemini Deep Researchは、Gemini 3 Proを用いた長時間・多段の情報収集と要約に特化したエージェントで、Interactions API経由で開発者が自アプリに組み込めるようになった。DeepSearchQAという新ベンチマークの公開や、金融・バイオテックなどでの高度な調査自動化、ファイル検索や構造化JSON出力・詳細な引用付きレポート生成などの機能を提供し、今後はSearchやNotebookLM、Vertex AIなどとも連携が拡張される予定である。
Interactions APIは、GeminiモデルとGemini Deep Research Agentの両方への統一インターフェースを提供し、ADKエージェントの推論エンジン兼状態管理基盤として機能する新APIです。 これにより、サーバ側での会話履歴管理、長時間タスクのバックグラウンド実行、「思考」と応答の分離などが可能になり、ADKでのエージェントループを簡素化できます。 また、InteractionsApiTransportによりA2Aプロトコルとマッピングされ、既存のA2AクライアントからGemini Deep Researchなどを通常のリモートエージェントとして透過的に利用でき、追加SDKや大きなコード変更なしでマルチエージェントシステムを拡張できます。
GitHub Copilot
Windows TerminalをGitHub Copilot CLIと組み合わせて快適に使うためのカスタマイズ方法を紹介する記事です。
記事の概要
- GitHub Copilot CLIの導入方法や、バナーを毎回表示する設定、Copilotのコンテキストのまま
!付きでシェルコマンドを実行する使い方を解説しています。 - Windows Terminal側では、Copilot専用プロファイル作成、ペイン分割、再起動時のタブ復元、背景画像やレトロ表示などの外観カスタマイズを取り上げています。
- Oh My PoshとNerd Fontを用いたプロンプト装飾や、GitHub Copilotの使用状況を表示するセグメントの追加方法も説明されています。
OpenAIの新モデルGPT-5.2が、GitHub CopilotのPro/Pro+、Business、Enterprise向けにパブリックプレビューとして提供開始されたという告知です。 VS Code、GitHub.comのCopilot Chat、GitHub Mobile、Copilot CLIなどからモデルピッカー経由で選択でき、企業プランでは管理者が設定で有効化し、個人プランではユーザー自身がモデルピッカーから有効化します。
アプリケーション開発
この記事は、AI Agentの自律性を4段階で整理し、高い自律度が必ずしも良いわけではなく、ユースケースに応じた使い分けが重要だと述べている。 自律性が有効なのはコーディングなど臨機応変さやメモリ活用が必要な場面であり、手順が固定されコスト予測や再現性が重い場面では慎重な導入が推奨される。 Google ADKを例に、CallbackやSubAgent、カスタムフローを組み合わせて「制御したい部分」と「自律させる部分」のバランスを取る設計方針が紹介されている。
Adobe
AdobeはChatGPT上でPhotoshopやExpress、Acrobatなどを使える「Adobe Apps for ChatGPT」を発表し、ChatGPTユーザーなら追加料金なしで高度な画像編集やデザイン、PDF編集が行えるようにすることで、プロ向けクリエイティブツールを誰でも扱えるようにする取り組みを始めた。
論文・その他
本記事は、英国公務員19万職種・約150万タスクをLLMで分析し、「AIは職種丸ごとの自動化より、タスク単位の効率化に向く」と示した研究を解説している。 AIがタスクの8割以上を担える完全自動化対象は全体の約18%にとどまり、多くの職種ではデータ入力や記録管理など一部業務のみが自動化され、その分を戦略立案・複雑な問題解決・ステークホルダー調整といった人間固有の仕事に再配分する「仕事の再設計」が鍵になる。 試算では、人員削減によるコスト削減(約11億ポンド)より、空いた時間を高付加価値タスクに振り向けることで得られる生産性向上効果(約52億ポンド)の方が一貫して大きく、AI導入は「人を減らす」のではなく「仕事の中身を作り直す」前提で考える方が経済的にも合理的だと結論づけている。
Turing Post創設者のKsenia Seが、2025年の生成AIの実態と2026年以降の焦点を語るポッドキャストです。企業ではエージェントよりもまずコーディング支援など内向き利用が進み、MicrosoftやGoogleによる一括提供で本格普及が加速すると指摘します。今後の注目分野として、ロボティクス/embodied AIと空間知能、世界モデル、科学分野のAI(化学・数学・量子・自動運転など)、さらに教育現場でのAI活用と問いの立て方・ファクトチェック教育の重要性を挙げています。またAI投資バブル懸念に触れつつ、LLM偏重から多様な研究領域へ関心がシフトすると見ています。
クラウド
Azure
Azure Cosmos DB vNext Linuxエミュレーターの最新プレビューでは、JOINや配列・文字列演算子、サブドキュメント取得などクエリエンジンが強化され、より複雑なローカル開発・検証が可能になりました。
さらに、OpenTelemetry対応とヘルスチェックエンドポイントが追加され、JaegerやPrometheusと連携したトレース・メトリクス収集や、テストコンテナなどからの起動待機判定が行いやすくなっています。
Azure Cosmos DB は、従来分離していたトランザクション DB と検索エンジンの機能を統合し、ベクター検索・フルテキスト検索・ハイブリッド検索を単一の分散 NoSQL データベース上で提供する「検索ネイティブ DB」へ進化している。 スキーマフリーな JSON と高性能な Inverted Index・BW-Tree ストレージを基盤に、DiskANN による大規模ベクター検索、BM25 によるランキング、RRF を用いたハイブリッド検索、将来のセマンティックリランクや自動埋め込み生成などを組み合わせ、AI/エージェント向けのリアルタイム検索体験をグローバル規模で実現することを目指している。
Microsoft Ignite 2025 の発表を中心に、Claude モデルの Foundry 統合、Microsoft IQ によるセマンティック検索、PostgreSQL 互換の Azure HorizonDB、Azure Copilot によるクラウド運用自動化、Cobalt CPU / Boost DPU など最新ハードウェアが紹介されています。 また、Microsoft Entra の Agent ID 公開プレビューや Security Copilot 連携、Prompt Shield による GenAI 保護強化、Windows Admin Center 2511 の GA、Azure Container Apps のワークロードプロファイルによるキャパシティ計画、VS Code 1.107 リリース、Fabric Lakehouse スキーマ GA や SSIS 2025 GA などがまとめられています。
エンジニア
プロダクト開発
プロダクト開発では「正しい判断」よりも、その材料となる多様な声やデータを集めることが難しく重要だと説いている。
PO/PdMの役割は、ユーザー・マーケ・営業・経営など不完全な真実を持つ関係者の意図を深く「聞き」、本当に守りたいものを見極めて一歩に変え、チームを一方向に導くことだと述べる。
話す力よりも、文脈や感情を含めて聞き出し統合する「聞く力」こそが最強の意思決定手段であり、聞くことでしか見えない景色と未来があると締めくくっている。
AIとお仕事
AIを活用したAI-DLCでは要件定義から実装まで多量のドキュメントをAIが生成し、人間は監視・レビュー役に特化するため、文章を素早く理解し本質を捉える読解力が重要なスキルになると述べている。 著者は自身の読書習慣によって「読む」と「理解」は別能力だと気づき、AI時代には読書が開発の基礎体力として価値を持ち続けると主張している。
技術書
この記事は、著者が2025年に読んで「刺さった」技術書25冊を通じて、AI時代のエンジニアリングと学びの意味を振り返った読書感想文です。
AIやLLM、AIエージェント、プラットフォームエンジニアリング、インフラ・クラウド、設計・アーキテクチャ、技術的負債、RustやPostgreSQLなど、多様なテーマの本を取り上げつつ、「AIにコードを書かせても、責任と説明は人間が負うこと」「結合は悪ではなくバランスが重要であること」「技術選定やモダナイゼーションはトレードオフと組織文脈の問題であること」などの共通する視点を抽出しています。
著者は、AIに聞けば正解らしきものはすぐ得られる一方で、本を通じて他人の失敗や遠回り、違和感に触れ、それを自分の言葉に変えていく非効率なプロセスこそが、自分の思考や「地力」をつくると繰り返し強調します。
おわりにでは、これらの本が「それでいいのか」と問いを投げかけ、自分がなぜエンジニアを続けるのか、AI時代に本を読む意味は何かという答えの出ない問いに向き合うための手がかりになったとし、「正解がないから面白いし、本を読み続ける理由になる」と結んでいます。
感想:
何となく本がかぶっている。Beyond Vibe Codingとソフトウェアエンジニアガイドブックは私もススメです。