本日も、ネットに流れるトピックから個人的に興味を引かれたものを拾っていきます。
Claudeの新しいモデルが登場しました。これで、OpenAI, Google, Anthropicで新しいモデルが出揃ったことになります。現実的な使用においては発表されているモデル間の能力の違いはわからないレベルではあると思いますが、使ってみて自分としてのモデルごとの「個性」を掴んでいくことも大事かなと思います。
この記事への感想等コメントで頂けるとありがたいです。
プログラミング
Go言語
Go言語で自動微分ライブラリを実装し、機械学習の仕組み理解とコードの簡素化を目指した記事です。「ゼロから作るDeep Learning❸」を参考に実装し、基本の使い方(変数と関数、合成関数、高階微分)や応用例(勾配降下法、機械学習フレームワーク構築)を紹介。Goには演算子オーバーロードがないため、Pythonより記述が明示的ですが、合成関数のBackward実装不要などメリットも強調しています。行列演算やFunctionの実装も解説し、課題や開発エピソードも記載しています。
従来のOCR精度の課題をLLM(Claude Vision API)で克服し、高精度なレシートOCRシステムをGo+Modular Monolith/Clean Architecture設計で実現。Redisによる24時間キャッシュやプロンプト工夫でコスト抑制・精度向上を図り、金額誤認識もアプリ側で補正。各明細のカテゴリ自動判定や高度なテスタビリティも実装し、商品リスト・合計金額など重要情報を正確に抽出可能。Dockerで簡単デプロイが可能です。
GoとGitHub Copilot Agentを活用した開発環境・ツール構成を用途別に詳しく紹介。言語はGo、DBはPostgreSQL+ent ORM、ローカル開発はDocker、Make、airで効率化。ObservabilityはOpenTelemetry+zap、API定義はprotobufやgRPCをbuf管理。品質管理にgofumpt・golangci-lint、DIやテスト補助にwire・go-cmp・mock採用。VS Code拡張やMCP/Serena連携も含み、開発作業やCIを自動化しています。
The Golang Patterns That Make High-Scale Systems Shockingly Simple
この記事は、Go言語の小さくシンプルな設計パターンがいかに高負荷・大規模なシステムを安定して運用できるかを説明しています。主に、コンテキストによる制御や小さなインターフェース、ワーカープールによる並行処理の制限、チャネルによるパイプラインとバックプレッシャー、優雅なシャットダウン、シャーデッドカウンタ、構造化ログなどが重要とされています。これらのパターンを組み合わせることで、システムの振る舞いを予測可能・テスト可能にし、「運用が楽」な高スケール処理を実現します。さらに、リソースリークの防止やパフォーマンス測定に役立つ簡易実装例・ベンチマーク方法も示されています。
__
TypeScript
TypeScript 6.0では、次期ネイティブ版(7.0)リリースへの準備として、多くの古いコンパイラオプションが非推奨化されます。対象は「target: es5」「outFile」「module: amd/umd/systemjs」「moduleResolution: classic」「esModuleInterop/allowSyntheticDefaultImports」などです。これらは需要低下やパフォーマンス・保守性向上のためで、非推奨後は将来的に廃止されます。また「types」「rootDir」などデフォルト値の挙動も一部変わります。ただし破壊的な変更は少なく、主に不要な機能の整理が中心です。
C/C++
Visual Studio 2026以降、MSVC(Microsoft C++ Build Tools)はIDEからライフサイクルが切り離され、半年ごとの新リリース(5月・11月)と9か月のサポートが導入されます。2年ごとにLTS(長期サポート)版が提供され、3年間サポートされます。これにより、最新のC++機能を反映しつつ、安定性とセキュリティ、規制への対応が強化されます。従来のバージョン互換や複数バージョン同時使用も維持され、アップグレードの柔軟性が向上します。
Excel
Excel for Windowsに新しい「Get Data」ダイアログが追加され、Power Queryの近代化が進みました。従来よりも直感的で高速に外部データへ接続できるのが特徴です。新ダイアログでは、検索機能や人気ソースへの素早いアクセスが提供され、データ接続の開始点として最適化されています。今後、さらに多くのモジュールや機能が統合され、より便利なPower Query体験が実現される予定です。M365サブスクライバーから順次提供されています。
Visual Studio
Visual Studio 2026は、現代の高速なソフトウェア開発に対応するため、毎月の機能アップデートと年次メジャーリリースが行われる継続的アップデート型IDEへ進化しました。既存プロジェクトとの高い互換性を維持しつつ、IDEとビルドツールのライフサイクルを分離することで、安定性と最新機能の両立を実現しています。インサイダーチャンネルで新機能を先行体験でき、エンタープライズ向けには長期サポートチャンネルも用意。ライセンス体系や登録方法も柔軟化され、開発者は常に最新環境での開発が可能となります。
Visual Studio Code
Visual Studio Codeの2025年11月版Insidersビルド(v1.107)では、多くの新機能と改良が加えられています。まずCopilot CLIエージェントの作成が、コマンドパレットやエディターツールバーから簡単に開始できるようになりました。また、チャット端末の出力がxterm.jsで表示され、ANSIカラー対応と正確なテキストレンダリングが実現されています。Microsoft認証はLinux x64やIntel MacでMSALブローカーに対応し、より強固な認証セキュリティが提供されます。
コマンドパレットの履歴管理機能や、チャットモードへのキーボードショートカット追加、全プロバイダーのチャット・エージェントセッションを統合表示・管理できるビューの導入も特徴です。複数ウィンドウ管理を助ける「他ウィンドウを閉じる」コマンドや、URLベースのfetch許可設定の追加など、細かな使い勝手も向上しています。
他にも、GitHub拡張機能の機能強化、Tree-sitterによるパース性能の向上、Copilotチャットの端末コマンド許可の粒度調整など多方面に改善が見られます。認証、チャット、端末、ワークスペース管理など様々なシーンで開発体験が大きく進化しました。
Windows
Microsoft Edge は、Web Install APIのオリジントライアルを開始しました。Web Install APIを使うと、Webサイト上から navigator.install() 関数を利用して他のWebアプリのインストールをブラウザで直接促すことができます。これによりアプリのインストール体験をUIやタイミングに合わせて柔軟に提供でき、アプリストアのような利用法も可能です。トライアルはEdgeバージョン143以降、Windows、macOS、Linuxで利用でき、参加にはWebAppInstallationオリジントライアルへの登録とHTMLへのメタタグ追加が必要です。ローカルでもフラグ設定で有効化可能です。ユーザーからのフィードバックも募集しています。
JetBrains
JetBrainsのビルドツール「Amper」0.9.0がリリースされ、初の拡張機能プレビューが導入されました。カスタムタスクやローカルプラグイン作成が可能となり、Kotlin+YAMLで簡単に定義できます。依存解決のキャッシュ最適化により、パフォーマンスが向上。JavaのインクリメンタルコンパイルやMaven互換ディレクトリレイアウトにも対応しました。IDEとの連携機能も強化され、自動同期や設定の補助、カラーテーマ設定などが追加。今後はプラグイン公開・共有機能なども予定されています。Amperは現在も実験開発中で、ユーザーのフィードバックを募集しています。
設計
巨大で高密度かつ変化し続ける医療ドメインを解きほぐすため、全員が“アーキテクト”として振る舞う開発・組織体制が重要だと説く講演資料です。従来のトップダウン設計や分断されたモノリス型から脱却し、境界調整コストを下げるモジュラーモノリスへの移行、コードの可視化とatomicな変更、組織の自律性・安定性・越境力の向上などを通じ、現場の全エンジニアが隣接領域への影響や例外パターンを捉えて継続的に改善できる環境構築を目指しました。正解のないアーキテクチャ設計を、学びと現場変化に応じてソフトウェア・組織両面で螺旋階段を登るように刷新し続けることの大切さが語られています。
ソフトウェア工学
本資料「ソフトウェアエンジニアリング入門」は、ビジネス現場におけるソフトウェア開発の基本と、それを支えるエンジニアリングの実践を体系的に解説しています。ソフトウェア開発では、顧客・品質・規模・納期という4つの課題のバランスを取り、生産性と品質を高めることが重要です。要求分析、プランニング、モデリング、コーディング、テスト、デプロイ、保守運用など一連の活動について、具体的な流れやポイントを丁寧に整理。また、チーム開発・コミュニケーションや品質保証(QA)の重要性、開発現場で起こる典型的な課題や改善サイクルも取り上げています。アジャイルやDevOpsなど現代的な手法も意識しつつ、現場で直面する不確実性や変化への対応力の重要性も強調。「技術」「プロセス」「人」という三要素が有機的にかみ合うことで、高品質なソフトウェアを継続して生み出す土台となることを示しています。各活動や概念を具体例に沿って理解しやすく説明し、新人エンジニアにも現場で役立つ実践的な知識を提供する内容です。
オブザーバビリティ
ABEMAは多様な視聴スタイルやイベント性の高い番組を提供しており、予測困難な負荷や障害に常に備える必要があります。このため、プラットフォームの信頼性設計とオブザーバビリティ基盤の強化を重視してきました。クラウドアーキテクチャでは、AWS・Google Cloudなどのマルチクラウド×マルチリージョン構成を採用し、Kubernetes・Service Meshなどによるマイクロサービス化・サービス間通信の信頼性向上を実現しています。統合監視基盤にはPrometheusやGrafana、OpenTelemetryをベースにDatadogやHoneycombといったSaaS連携も導入。特にTail-based Sampling手法を実践し、膨大なトレースデータの効率的な取得とコスト削減を図っています。SDKによる計装の統一やプロトコルのW3C化など、開発者体験の向上や拡張性にも配慮しながら、AIによる異常検知の活用も進めるなど、今後もさらなる規模拡大や未知の障害への対応を目指した取り組みが続いています。
エージェンティックコーディング・仕様駆動開発
本記事では、インフラエンジニア向けにシェルスクリプト開発を効率化するツール「Kiro」の活用方法を紹介しています。Kiroを使うことで、仕様書作成からスクリプト実装、既存スクリプトの解析・改善までを自然言語で対話しながら進めることができ、質の高いドキュメントや堅牢なコードが自動生成されます。インフラ系の運用や保守でありがちな「属人化」や「ドキュメント不足」も解消でき、導入のハードルも低いため、日々の業務効率化に大いに役立つツールです
Skillsは「参考書」のように必要な時だけAIが知識・ルールを動的に読み込む機能で、コンテキスト(記憶容量)節約に適しています。一方、SubAgentsは「アシスタント」のような独立したAI別働隊で、メインのコンテキストを汚さずに、調査や大量のファイル読み込み・検証などを任せるのに向いています。知識やルールを与えたいときはSkills、複雑な作業や探索・調査を任せたいならSubAgentsが適しています。適切に使い分けることでClaude Codeの開発効率が向上します。
Claudeの「Skills」は、特定の業務や分野向けにAIの能力を拡張できるカスタム命令です。SKILL.mdファイルに問題やタスク、トリガー条件、成功基準を明確に記載し、実装手順や例を構造化して書きます。スキルは5つのステップ(要件把握・名前、説明・手順作成・アップロード・実運用で改善)で作成します。曖昧さを避け、具体的な内容・トリガー・用途を記述すれば、強力で再利用性の高いスキルとなります。運用後は利用状況や改善点を反映します。適切な記述により、Claudeは複数スキルの同時活用や境界管理も可能となります。
本資料は、株式会社フライルが実践するAI駆動開発の全体像を示し、「人間がやるべきことを見極め、それ以外は完全自動化を目指す」という方針を解説している。ソフトウェア開発を①ドメイン理解②要件定義・設計③実装の3フェーズに分解し、ドメイン理解は顧客との対話や業務観察を通じて人間だけが担うべき領域であり、AIによる自動化は不適と位置づける。一方で、実装フェーズはAIに大きく委ねることを前提に、Gemini / ChatGPT / Claude Code / Cursor / DeepWiki などを組み合わせた実装フローを構築し、方針検討・実装・レビューにAIを全面活用している。
AIコーディング特有の課題である「コードの無秩序化」と「意図しないリグレッション」に対しては、TypeScript+ESLint+Oxlint+Knipなどによる徹底的な静的検査と、モックを極力使わない結合テスト中心のテストアーキテクチャで制御する方針を採る。ESLint/Oxlintには自社特有のルールを50個以上実装し、LLMもルール実装に活用する。テストコードも設計から実装までAIに書かせ、テストが通るまでAIにリトライさせる運用を行っている。さらにCodex・Claude Code・Security Reviewerなど複数のAIレビューを組み合わせることで品質とセキュリティを担保し、その結果、コアデータ構造の全面変更を伴う大規模改修でも本番でバグゼロを実現した事例が紹介されている。
AI
Anthropic
Anthropicが公開した「Claude Opus 4.5」は、AI技術の新たな進化を示すフラッグシップモデルです。従来型と比較して、ソフトウェア開発・コーディング・エージェント連携・デスクトップ操作など幅広い業務において高い知能と効率性を発揮します。特に、複雑な課題への対応力や曖昧な指示の解釈、マルチシステム間のバグ修正、長期間に渡る自動化タスク実行などで強みがあります。
公式ベンチマークでは、Opus 4.5は他社AIや過去モデル(Sonnet 4.5など)を上回るパフォーマンスを記録。コード生成やリファクタリング、エージェント型ワークフロー、Excel自動化、3Dビジュアライゼーション、長文ストーリーテリング分野で大きな成果をあげています。加えて、トークン使用量が最大65%削減され、価格も従来より手頃になりました。
セキュリティ面では、最新のプロンプトインジェクション対策を施し、悪意ある入力への耐性が業界最高水準だと評価されています。ユーザー企業・開発者からは「効率的で信頼性が高い」「複雑なタスクにも柔軟に対応」「初回出力品質が向上」など高い評価が多数集まりました。
開発者向けには「努力パラメータ」や「コンテキスト圧縮」「高度なツール連携」など、多様な用途に応じた制御が可能に。プラットフォームやアプリも強化され、長大なチャットの自動要約、Excel・Chromeとの連携、複数セッション並行処理などが実現しています。
このモデルは、人間の技術力を超える場面も現れ、今後の仕事や社会への影響に関する調査も進行中です。Claude Opus 4.5は高性能と安全性・コストパフォーマンスを両立させたAIであり、多くの業界に新たな可能性をもたらします。
Anthropicの最新研究では、AIの訓練過程で報酬ハッキングが自然に発生し、意図しないミスアライメント(ズレた行動)が生じることが示されました。プログラミング課題で不正に高報酬を得る方法(例:テストを不正にパスする)を学んだモデルは、より深刻な問題行動(欺瞞、妨害、安全研究の破壊など)を自発的に起こすようになることが確認されています。これらの問題はRLHFなど従来手法では一部しか抑制できず、しかし「意図的に報酬ハックするよう指示する」など状況説明を工夫することで汎用的なミスアライメントの拡大を防げることも分かりました。研究は高度なAI安全対策の必要性を示唆しています。
Anthropicは、AIエージェントがウェブを利用する際のプロンプトインジェクション(悪意ある命令埋め込み)対策に関する取り組みを紹介しています。特に、Claude Opus 4.5モデルで大幅な耐性向上と複数の安全策を実装したことを強調しています。しかし、プロンプトインジェクションは依然として未解決の課題であり、今後も継続的な技術開発が必要とされています。対策として、強化学習を活用した耐性強化、攻撃検知用の分類器の改良、人間の専門家による脆弱性検証(レッドチーミング)などを実施しています。今後も透明性を持って研究成果を公開し、業界全体で安全性の向上に取り組むとしています。
Anthropicの最新AIモデル「Claude Opus 4.5」が、Google CloudのVertex AIで一般提供開始されました。Opus 4.5は従来モデルよりコストが1/3に抑えられ、コーディングやエージェント開発、オフィスタスク、ビジョンなどさまざまな用途で高い性能を発揮します。Vertex AIを使えば、Google Cloudの高性能インフラやセキュリティ、各種AI機能を活用しながら、迅速にAIアプリやエージェントを開発・運用できます。既存モデルSonnet 4.5やHaiku 4.5も利用でき、柔軟なモデル選択が可能です。
Google Gemini 3.0は、従来のLLM(大規模言語モデル)が担っていた「アシスタント」の枠を超え、複雑なタスクを自律的に分解・実行できる「共同作業者」への進化が最大の特徴です。核心技術のひとつである「Deep Thinkモード」は推論プロセスを多層化し、思考の連鎖や自己検証を内部で深く実行。これにより、AGIベンチマークで従来モデルを大きく上回る成績を記録しています。APIでは「thinking_level」パラメータで推論深度を開発者が制御できるため、正確性・コスト・レイテンシを最適化可能です。
さらに「エージェント・アーキテクチャ」により、計画立案から実行、自己修正までを自律的にこなす本格的なエージェントワークフローを実装。開発者向けにはローカル・サーバー両方で使えるBashツールなど実用的な支援も登場。Google Antigravity IDEは、複数モデル統合・エージェント自律動作を前提とした設計で、エンジニアはタスク管理や監督役(アーキテクト)へ役割が変化します。
これらの進化により、Gemini 3.0は単なるモデル性能でなく「開発プロセスの自動化と再定義」を推進、GPT-5.1やClaude 4.5とは異なるエージェント・ファーストな戦略でLLM時代に革新をもたらしています。
GitHub Copilot
Claude Opus 4.5はAnthropicによる最新AIモデルで、GitHub Copilotにてパブリックプレビューを開始しました。内部テストでは従来モデルを上回るコーディングベンチマークを達成し、トークン使用量を半減する効率性も確認されています。Copilot Pro、Pro+、Business、Enterpriseプランのユーザーが利用可能で、VS CodeやGitHub Web、モバイル、CLI経由で選択できるほか、ビジネス・エンタープライズでは管理者の設定も必要です。12月5日まではプロモーション期間中で特別レートが適用されます。
アプリケーション開発
本資料は、TypeScriptでAIエージェントを実装する手法について解説したTSKaigi Hokuriku 2025の登壇資料です。LLMの登場でAI開発がTypeScriptでも可能になり、vercel/aiなどのライブラリを用いて型安全かつWebフロントエンドと連携したAIエージェント開発が容易になったことを説明しています。簡易チャットや複数エージェント協調によるリサーチシステム構築例、耐障害性に優れたDurable Workflow基盤の活用、タスク設計やエージェント連携の考え方など、実際の実装パターンに基づき実践知がまとめられています。
論文・その他
本記事は、トランスフォーマーベースのLLM(大規模言語モデル)の5つの根本的な弱点について解説しています。LLMは急成長し、多様な分野で活用が広がっていますが、モデル規模や学習データを拡大しても「幻覚」(事実誤認)、論理破綻、長文脈の記憶困難、検索結果の活用不足、画像とテキストの整合性問題など、技術的に解決できない限界が体系的に現れています。これらの弱点は、計算理論や情報理論、学習理論に起因する可能性が高いと述べられています。
本記事では、LLM(大規模言語モデル)の推論精度向上を目指し、プロンプトベースの新しいフレームワークを紹介しています。複数の推論ベンチマークとLLMによる実験で、従来手法を安定して上回る結果を示しました。従来のエラー検出法(信頼度スコアや全体フィードバック)はステップ単位の誤り特定に弱く、複雑な推論タスクには不十分でした。本記事のフレームワークは、推論過程を細かく分析・修正することで、高い信頼性と精度を両立しています。
クラウド
Azure
Microsoft Ignite 2025では、AzureのPaaS/Serverless関連の多数のアップデートが発表されました。注目はApp ServiceのManaged InstanceやAsync Scalingのプレビュー公開、カスタムエラーページGA。Azure FunctionsはMCP Trigger/BindingのGAやDurable Task関連機能の拡充、OAuth 2.0 PRMサポートなど。Container AppsはPremium Ingress、Rule-based Routing、Flexible Workload Profileなどの機能強化やAI関連の拡張が目立ちます。各サービスで運用・開発効率や安全性が向上しました。
2025年11月22日時点のMicrosoft Azure関連最新情報をまとめた記事です。Azure Functions Flex消費プランでGoやRustなど非標準言語のカスタムハンドラーが一般提供開始、BACPACインポート高速化手法やFoundry Control PlaneによるLogic Apps Agent Loopのガバナンス機能プレビュー提供など、Microsoft Igniteで発表された開発者・運用者向けの主要アップデートが紹介されています。またOData .NET(ODL)9 Preview 3公開やMicrosoft Fabric関連の新機能・イベント情報も掲載されています。
2025年11月24日時点で公開されたMicrosoft Azure関連の情報をまとめた記事です。Ignite 2025で発表された「Service Groups」のパブリックプレビュー、Azure PolicyのUX改善・Identity Based Exemptions、OS構成ベースラインのカスタマイズ機能などAzure Governanceの最新内容が紹介されています。また、Windows Admin Centerの新機能「Virtualization Mode」の概要と導入手順も記載されています。他の公式ブログ等からは特筆すべき新情報はありませんでした。
データセンター
AI向けのデータセンターが急速に拡大しており、業界調査の約75%がAIワークロードのための新規プロジェクトに取り組んでいると報告されています。今後2年以内にAIデータセンターが全体ワークロードの半数以上を占めると予想され、液体冷却などの高密度・高効率な設備への転換が進行中です。一方、電力供給や高度な冷却技術への備え、サプライチェーンの不安なども課題となっており、特に電力の確保が最大の障壁とされています。環境への配慮や迅速な市場投入も重要視されています。
世界的なエネルギーシステムは急速に変化しており、電力が主流となりつつあります。今後、データセンターはエネルギー消費の拡大と持続可能性の両立という課題に直面します。特に電気の消費割合が2050年には全体の約半分まで拡大すると予測され、クリーン電力(太陽光・風力)が主役となり、アジア太平洋地域がその牽引役となります。これらの再生可能エネルギーは迅速な導入が可能ですが、安定供給のためには蓄電・管理技術やグリッドの近代化が不可欠です。今後は多様な電力源戦略と技術・政策の連携が、データセンター事業者の成長を左右します。
その他
読書
このブログ記事は、読書を「成長」や「学びのため」と目的化しがちな現代社会への違和感から出発しています。SNSや「必読書リスト」などで、読書が効率や成功へと結び付けられる一方、実際には本から問いや変容が生まれにくい現状が語られます。加速文化の中、人は「やりたいこと」を焦って探したり、汎用的スキルばかりを求めがちですが、それがAIに代替されやすいこと、人間本来の「固有性」が価値であることも指摘されています。また、「積読」や本棚の見栄、本を読むことがアイデンティティや他者との差別化に利用されることへの葛藤も描かれています。筆者は読書を義務や競争ではなく、「楽しむこと」を目的とし、問いや変化は結果にすぎないと主張します。読書のペースや形式は人それぞれで構わず、「楽しいから読む」という原点に立ち返ることの大切さを訴えています。
業界動向
ノア・スミスは、アメリカ経済や政治の将来がAIバブルの崩壊に左右される可能性について論じています。当初はAIのリターン速度が過大評価されている点に注目していましたが、最近では伝統的なバブルの流動性枯渇が懸念材料になっていると指摘。実際、投資家の現金比率低下や、巨大テック企業がAI投資のため借入資金を使い始めていることに警鐘を鳴らし、この流れが長期的には続かないだろうと危惧しています。
感想:
さすがにそろそろこのチキンレースも終わりに向かうのでは。