本日も、ネットに流れるトピックから個人的に興味を引かれたものを拾っていきます。
本日は、目まぐるしく進化するAIツールと、それを支えるプラットフォーム・言語の最新動向を幅広くピックアップしました。AI界隈では、圧倒的な性能を誇る「Claude Sonnet 4.6」のリリースや、各社で対応が進むMCP(Model Context Protocol)の拡充など、エージェンティックな開発手法がいよいよ実用段階に入ってきた熱気を感じます。一方でプログラミング関連では、Go 1.26のgo fix運用のリアルな罠やnpmのセキュリティ強化、AWSを活用した安価なセマンティック検索基盤の構築など、明日の業務にすぐ活かせそうな実践的な知見も揃っています。
この記事への感想等コメントで頂けるとありがたいです。
プログラミング
Go言語
Go1.26で強化された go fix コマンドを実プロダクトに適用した際の注意点をまとめた記事です。
主な問題は3点あります。
①別パッケージの定数・独自型・型エイリアスを引数に取るジェネリクスのポインタ変換関数(ToPtr)は new 関数へ自動置換されないため手動対応が必要。
②staticcheck(SA4006)が新しい new(値) パターンを誤検知しCIが失敗するが、//nolint:staticcheck で回避可能(v0.7.0で修正済み)。
③VSCodeで古い gopls を使っていると型エラーが表示されるため、事前にツール更新が必要。go fix 自体は便利だが、周辺ツールが追いついていない点に注意が必要です。
GitHub
2025年にGitHubでは約3,600万人の新規開発者が参加し、オープンソースはかつてないグローバルな規模に成長しました。成長の背景にはAIの貢献がありますが、一方で低品質なAI生成コード("AI slop")の増加がメンテナーの負担を増大させています。また、貢献者数に対してメンテナーの数が追いついておらず、明確なコントリビューターからメンテナーへの昇格パス、分散型ガバナンス、充実したドキュメントの整備が求められています。急成長プロジェクトの約60%はAI関連で、開発の場は世界規模へ拡大しています。2026年は単一のトレンドではなく、コードだけでなくプロセスへの投資がオープンソースの持続的発展の鍵となると締めくくられています。
npm CLI v11.10.0 で2つの新機能が正式リリースされました。
一括 OIDC 信頼済みパブリッシング設定:npm trust コマンドで複数パッケージの設定を一度に行えるようになりました。
--allow-git フラグ:Git 依存関係の .npmrc が任意コード実行を引き起こすリスクに対処するため、--allow-git=none の使用が強く推奨されており、npm v12 ではデフォルトになる予定です。
セマンティック検索システム
本記事では、Amazon S3 VectorsとAmazon Bedrockを組み合わせ、DevelopersIOの約6万件の記事データを対象にサーバーレスなセマンティック検索基盤を構築する手順を紹介している。
構成は大きく3ステップで、まずBedrock Batch Inferenceで記事タイトルと要約を一括ベクトル化し、次にそのベクトルをタイトル・著者・slug・公開日・言語などのメタデータとともにS3 Vectorsのインデックスに登録、最後に検索ワードをベクトル化してS3 Vectorsで類似検索を行う。
Embeddingモデルにはコストが低い「amazon.nova-2-multimodal-embeddings-v1:0」を採用し、全量57,000件の処理コストは約$0.12と非常に安価に抑えられた。メタデータにフィルタリング可能な項目を持たせることで、著者や公開日による絞り込みもDB問い合わせ不要で実現している。
構成はフルマネージド・サーバーレスで管理の手間がなく、まず手軽にセマンティック検索を試したい場面に適している。一方、クエリあたりの取得件数が最大100件に限られるため、ハイブリッド検索や複雑なランキングが必要な大規模ユースケースには OpenSearch の利用を検討することが推奨されている。
補足:
完全に個人的メモ。このプログラミング雑記を外部記憶化したい。
エージェンティックコーディング・仕様駆動開発
Claude CodeとCodexを併用する際、CLAUDE.mdとAGENTS.mdを別々に管理する手間を省くための方法を紹介した記事です。Claude CodeはデフォルトでAGENTS.mdを読まないため、著者はClaude CodeのHooks機能(SessionStart)を活用し、セッション開始時にcat AGENTS.mdコマンドを自動実行する設定を.claude/settings.jsonに追加しました。これにより、Claude CodeがAGENTS.mdの内容を自動で読み込めるようになり、CLAUDE.mdを削除してAGENTS.mdだけで両エージェントを統一管理できるようになります。
この記事は、エンジニア向けに2026年2月時点でおすすめのMCPサーバーを紹介しています。
**最新注目ツール(4選)**として、テキストから図を自動生成できる「Draw.io MCP」、コードベースをセマンティック検索できる「Serena」などを紹介。
**鉄板ツール(5選)**には、GitHub・Docker・PostgreSQL/SQLite・Chrome DevTools・Playwright MCPが挙げられており、コード管理からDB分析、ブラウザ自動化まで開発効率を大幅に向上できるとしています。
情報収集系ではBrave Search・Tavily/Exaが推奨されており、AIの知識カットオフを補完できます。
筆者の推奨構成は「GitHub・Filesystem・Brave Search or Tavily・Draw.io・Serena」の5つです。
AI
Anthropic
Anthropicは、これまでで最も高性能なSonnetモデル「Claude Sonnet 4.6」を発表しました。コーディング、コンピューター操作、長文脈推論、エージェント計画、知識業務、デザインなど、あらゆる分野で前モデルから全面的に強化されています。また、ベータとして100万トークンのコンテキストウィンドウを搭載しています。
主な改善点
コーディング能力が大幅に向上し、早期アクセスユーザーの多くがSonnet 4.5だけでなく、2025年11月のフロンティアモデル「Opus 4.5」よりもSonnet 4.6を好むと評価しています。Claude Codeでは、ユーザーの約70%がSonnet 4.5より4.6を選び、また59%がOpus 4.5より4.6を好んでいます。過度なエンジニアリングや「怠慢」が少なく、指示への追従精度も向上しています。
コンピューター操作(Computer Use)
2024年10月に業界初の汎用コンピューター操作モデルを発表して以来、急速に進化を続けています。標準ベンチマーク「OSWorld」での性能が着実に向上し、複雑なスプレッドシート操作や多段階のWebフォーム入力において人間レベルの能力が確認されています。また、悪意ある「プロンプトインジェクション攻撃」への耐性も大幅に強化され、Opus 4.6と同等の安全性を達成しています。
長文脈・推論能力
100万トークンのコンテキストウィンドウにより、巨大なコードベース、長大な契約書、多数の論文を一度に処理可能です。シミュレーションビジネス評価「Vending-Bench Arena」では、序盤に積極投資し終盤で収益性へ戦略転換するという独自のアプローチで競合モデルを上回りました。
安全性
広範な安全評価の結果、他の最新Claudeモデルと同等以上の安全性が確認されており、「温かく誠実で社会的な性格と、強固な安全行動を持つ」と評価されています。
利用方法と料金
全てのClaudeプラン(Free・Pro含む)でデフォルトモデルとなり、料金はSonnet 4.5と同じ(100万トークンあたり入力$3/出力$15)です。Claude API、Claude Code、主要クラウドプラットフォームでも利用可能です。
AnthropicはClaude CodeとパブリックAPIの数百万件のインタラクションを分析し、AIエージェントの自律性を調査した。主な知見は以下の通り。
- 自律時間の増加:Claude Codeの上位セッションで、人間の介入なく稼働する時間が3ヶ月で約25分→45分以上に倍増。
- 経験者ほど自律を許容:熟練ユーザーほど全自動承認の割合が増加(20%→40%超)する一方、割り込み介入も増え、監視スタイルが変化。
- AIも自ら一時停止:複雑なタスクでは、人間の割り込みより Claude 自身が確認のため停止する頻度が2倍以上高い。
- リスクの高いドメインは未成熟:ツール呼び出しの約50%はソフトウェア開発で、医療・金融・セキュリティ分野での利用は拡大中だが規模は小さい。アクションの大半は低リスクかつ可逆的。
今後は、モデル開発者・製品開発者・政策立案者それぞれが、事後監視インフラの整備やユーザーの介入を支援するUI設計に取り組む必要があると結論づけている。
Figma
FigmaはデザインキャンバスとコードAIの融合を推進するという方針を示しています。AIコード生成が台頭する中でも、デザインのクラフトや視点こそが本質的な差別化要因であるとFigmaは主張します。プロンプト入力よりもビジュアルキャンバスの方が多くの可能性を探索しやすいという考えのもと、ターミナル・プロンプト・ビジュアルUIなどどこからプロダクト開発を始めても、Figmaがその中心になれるよう目指しています。新機能として、Claude CodeからFigmaへの連携(MCP経由)が本日より利用可能になりました。
Wordpress
WordPress.comは、エディターとメディアライブラリに統合されたAIアシスタントを発表した。従来のAIツールとは異なり、サイト内部で直接動作し、レイアウト調整・スタイル変更・コンテンツ編集・画像生成・翻訳などをテキスト指示だけで実行できる。またブロックノート機能でチームメンバーとAIを交えたコラボレーションも可能。ビジネス・コマースプランのユーザーは追加費用なしで利用でき、設定画面から数クリックでオプトイン可能。ブロックテーマでの利用が推奨されている。
GoogleはGeminiアプリにDeepMindの最新音楽生成モデル「Lyria 3」をベータ版として導入しました。テキストや画像・動画をもとに30秒のオリジナル楽曲を生成でき、歌詞の自動生成、スタイル・テンポなどの細かい制御、より高品質でリアルな楽曲制作が可能です。YouTube「Dream Track」にも対応し、クリエイターのショート動画向けサウンドトラック生成も強化されます。生成楽曲にはAI識別用の電子透かし「SynthID」が埋め込まれ、著作権への配慮も行われています。18歳以上のユーザーを対象に英語・日本語など8言語で提供開始です。
GoogleはAIエージェントがデータベースに安全・簡単にアクセスできるよう、オープン標準のMCP(Model Context Protocol)に対応したマネージドMCPサーバーを拡充した。今回新たに、AlloyDB(PostgreSQL)、Spanner、Cloud SQL、Firestore、Bigtableへの対応を追加。開発者はインフラを自前で用意せず、エンドポイントを設定するだけでエージェントから各データベースへ接続できる。IAMによるセキュリティやCloud Audit Logsによる完全な監査にも対応。さらに、IDEをGoogle公式ドキュメントに接続する「Developer Knowledge MCPサーバー」も導入。AnthropicのClaudeなど他社AIクライアントとも連携可能で、今後はLookerやBigQueryなどにも拡張予定。
Google CloudとAb Initioは、エンタープライズのAIエージェント活用を加速するための連携を発表しました。企業データはクラウド・オンプレミス・レガシーシステムに分散しているため、AIモデルが必要なデータやメタデータにアクセスするのが困難です。Ab InitioはDataplex Universal CatalogやBigQuery、Geminiと統合し、500以上のソースとの双方向メタデータ交換やエンドツーエンドのデータリネージを提供。マルチクラウド環境のデータを統一的に管理するハブとして機能し、Geminiが信頼性の高いコンテキストをもとに自律的かつ説明可能な推論・行動を実現できる基盤を整備します。
Google Cloudが提供する2つのAIエージェントツールの使い分けを解説した記事。AntigravityはGUIベースのIDEで、事前インストール不要。Agent Managerで複数エージェントを管理でき、統合ブラウザによる視覚的フィードバックが特長。エージェントを活用したいすべてのユーザー向け。一方Gemini CLIはターミナルで動作するCLIツールで、npmでインストール可能。ヘッドレスモードによりCI/CD統合や自動化に適しており、技術者向け。両者は拡張性(MCP・Agent Skills対応)など多くの機能を共有しており、どちらも無料枠あり。迷った場合は両方を試すことが推奨されている。
GitHub Copilot
Claude Opus 4.6がGitHub Copilotで利用可能になり、Visual Studio、JetBrains IDE、Xcode、Eclipseなど主要な開発環境に対応しました。Copilot Enterprise、Business、Pro、Pro+ユーザーが対象で、チャットのモデルピッカーから選択できます。BusinessおよびEnterpriseの管理者はCopilot設定でポリシーを有効化する必要があります。
Visual StudioからCopilotコーディングエージェントにタスクを委任できるようになりました。Copilot Chatでプロンプトを入力し「Send to Copilot Coding Agent」ボタンを押すと、Copilotがバックグラウンドでクラウド上に作業し、ドラフトプルリクエストを作成してレビューを依頼します。利用にはVisual Studio 2026(December Update 18.1.0以降)と対応するCopilotプランへの加入が必要です。
RaycastからGitHub CopilotのコーディングエージェントにIssueをアサインできるようになりました。RaycastのGitHub Copilot拡張機能をインストールすると、「Assign Issue to Copilot」コマンドでリポジトリとIssueを選択し、Copilotにタスクを委譲できます。Copilotはバックグラウンドで自律的に作業し、完了後にプルリクエストを作成してレビューを依頼します。Copilot Pro / Pro+ / Business / Enterprise ユーザーが対象です。
OpenAI
Introducing Lockdown Mode and Elevated Risk labels in ChatGPT
OpenAIは2026年2月13日、ChatGPTにおけるプロンプトインジェクション攻撃への対策として2つの新機能を発表しました。
ロックダウンモードは、企業幹部やセキュリティチームなど高リスクユーザー向けのオプション設定で、ChatGPTが外部システムと連携する範囲を厳しく制限します。ウェブ閲覧をキャッシュコンテンツに限定するなど、機密データの流出を防ぎます。ChatGPT Enterprise等で利用可能で、今後コンシューマー向けにも展開予定です。
「Elevated Risk(高リスク)」ラベルは、追加リスクをもたらす可能性のある機能に一貫した警告表示を付けるもので、ChatGPT・ChatGPT Atlas・Codexに導入されます。リスクが十分に軽減されたと判断された際にはラベルが削除されます。
Introducing EVMbench
OpenAIとParadigmが共同で、AIエージェントのスマートコントラクト脆弱性に対する能力を評価するベンチマーク「EVMbench」を発表しました。40件の監査から抽出した120の脆弱性を用い、①検出(脆弱性の発見)、②修正(脆弱性の除去)、③悪用(資金搾取攻撃の実行)の3モードで評価します。最新モデルのGPT‑5.3‑Codexは悪用モードで72.2%を達成し、6ヶ月前のGPT‑5(31.9%)から大幅に向上。スマートコントラクトは1,000億ドル超の資産を保護しており、AIを防御的に活用するための測定ツールとして、タスク・ツール・評価フレームワークを公開しています。
LangChain
LangSmithのAgent Builderが大幅アップデートされました。主な新機能は3つです。
①中央チャットエージェント(Chat):ワークスペースに接続された全ツール(Slack・Gmail・Linearなど)にアクセスでき、専用エージェントを作らずにすぐ質問・操作が可能。会話の流れからワンクリックで再利用可能なエージェントに変換できます。
②ファイルアップロード:CSV・画像・テキストファイルをチャットに直接アップロードし、データ分析や画像処理、参照資料としての活用が可能になりました。
③ツールレジストリ:全ツールの確認・認証・追加を一か所で管理でき、管理者によるガバナンス制御も可能です。
論文・その他
LLMに道徳的判断をさせる際、「じっくり考えて」と指示する複雑な多段階思考は、トークンを10倍以上消費しながら精度・安全性ともにシンプルな手法に劣ることが、11種類のプロンプト戦略を4モデルで検証した研究で明らかになった。最も効果的なのは「少数の具体例を示す(Few-Shot)」と「簡潔な役割を与える」手法。モデル別ではGPT-4.1が能力・安全性のバランスで最優秀、Claudeは道徳判断力は高いが過剰拒否の傾向があった。万能なプロンプトは存在せず、モデル特性に合わせた設計が重要だと結論づけられている。
従来のソフトウェアは「同じ入力には同じ出力」という決定論的前提で設計されてきたが、AIはその前提を根本から覆す。LLMは同じプロンプトでも異なる出力を生成する「非決定論的な依存関係」であり、単なるAPIとして扱うのは誤りだ。
具体的な問題として、①リトライが新たな出力を生み失敗を増幅させる可能性、②テストの繰り返し可能性が失われること、③観測性の面でAIの誤出力はエラーレートに現れず静かに品質を劣化させることが挙げられる。
対策としては、AI機能を明確な境界で隔離し、出力の変動が重要なロジックに漏れないようにすること、「正しさ」より「許容できるか」という基準に切り替えること、そしてガードレールやフォールバックを設計の中心に置くことが重要だと論じている。
クラウド
Azure
Azure Updates (2026-02-19) | ブチザッキ
2026年2月19日付けのAzure Updatesの主なトピックは以下の通りです。
Azure Functions・Logic Apps:.NET 10サポートおよびFlex ConsumptionのトラブルシューティングツールがGA。BizTalkからLogic Appsへの移行ツールも公開。
仮想マシン・AKS:VMSSでAutomatic Zone Balance(ゾーン間の自動負荷分散)がPreview公開。Premium SSD v2/Ultra Diskの増分スナップショット即時アクセスがGA。AKSではKubernetes 1.34サポート、ノード自動プロビジョニング関連の複数機能がGAとなったほか、AKS向けエージェントCLIのクラスターモードがPreview。
AI・Claude:Azure DatabricksおよびMicrosoft FoundryでClaude Sonnet 4.6が利用可能に。Azure CopilotのAI主導クラウド運用機能も紹介。
Power Platform・Microsoft Fabric:Power AppsのMCPサーバーがPreview公開。FabricではSQL database、AI関連の課金更新、SSMSやVS CodeへのAIアシスタント統合など多数の更新。
Windows 11:MIDI 2.0および強化版MIDI 1.0のサポートがGA。Windows MIDI Serviceにより、複数アプリが同一MIDIデバイスを同時利用可能に。
その他:MCP関連のツール・設計パターンが多数紹介され、Microsoftのカーボンネガティブ対応のマイルストーン達成も報告された。
OS
Ubuntu
Ubuntu向けアンチウイルスソフト ClamAV のオンアクセススキャン設定方法を解説した記事です。
Linuxはウイルスの主要ターゲットではないものの、サーバー運用や企業のセキュリティポリシー対応としてアンチウイルスが必要な場面があります。現在のLinuxカーネルには fanotify 機能があり、ClamAVの clamonacc がこれを利用してリアルタイムスキャンを実現しています。
設定手順は、clamav と clamav-daemon のインストール後、freshclam でシグネチャを更新し、clamd.conf でroot権限付与とスキャン対象ディレクトリ(/home)を指定。最後に clamav-clamonacc サービスを起動することで、ファイルへのアクセスをリアルタイムにブロックできます。テストファイル(EICAR)で動作確認も可能です。
