あらためて、あけましておめでとうございます。本日より仕事始めの方も多いかと思いますが、今年もよろしくお願いいたします。
本日も、ネットに流れるトピックから個人的に興味を引かれたものを拾っていきます。
この記事への感想等コメントで頂けるとありがたいです。
プログラミング
Python
本記事は、Pythonパッケージ管理ツールuvがなぜ爆速なのかを、pipとの比較を通じて解説している。
uvはRust製であること以上に、setup.py 実行などPythonの歴史的負債を捨て、pyproject.toml ベースの静的解析に特化し、レガシー形式やシステムPythonインストールを切り捨てた設計によって高速化を実現している。
GitHub
GitHub Actions の GitHub ホストランナー利用料金が最大39%値下げされ、2026年1月1日から適用されました。
パブリックリポジトリでの標準ホストランナー利用はこれまで通り無料で、詳細はExecutive Insights記事や料金ドキュメント、料金計算ツールで確認できます。
COBOL
老朽化したCOBOL基幹システムの移行需要が高まる一方、COBOL人材の不足とスキル継承難が深刻化している状況を解説した記事。 企業はリホストやリビルド、Java等へのリライトに取り組むとともに、トヨタシステムズのレガシーコードラボ設立や自動変換サービス、生成AIを用いたコード理解・テストコード生成などで人材不足を補おうとしている。
エージェンティックコーディング・仕様駆動開発
AI時代のコードレビューでは、タイポやスタイル、典型的なパフォーマンス問題などの実装の細部はAIや自動ツールに任せ、人間はドメイン設計やアーキテクチャ方針、ビジネス価値との整合性といった設計の妥当性に集中すべきだと述べている。
生成AI導入後にPR数やリードタイムを分析したところ、AI生成コードの理解不足によるPR品質低下とレビュー負荷増大が判明し、それを解決するために過去のレビューコメントをLLMで分析して個人専用チェックリストを生成し、Claude Codeでセルフレビューと修正まで自動化する仕組みを導入した事例を紹介している。
AI
IQuest
IQuest Coderは、ソフトウェアエンジニアリングと競技プログラミング向けの次世代コードLLMファミリで、7B/14B/40BおよびLoop構造の40Bモデルを提供する。Code-Flowに基づく多段階学習と長文・推論データにより高い推論性能を実現し、Thinking/Instructionの2系統でポストトレーニングされている。 LoopアーキテクチャによりHBMとKVキャッシュを削減しつつ高スループットを達成し、SWE-BenchやLiveCodeBenchなどの主要コードベンチマークで高いスコアを示す。 単一GPUでの効率的な推論や、競技プログラミング・物理シミュレーション・ゲームなどのインタラクティブなショーケースも特徴となっている。
RAG
本記事は、RAGアプリの精度評価を開発者の主観や目視確認に頼らず、LLM を判定者とするフレームワーク Ragas を使って自動化する方法を解説している。
Ragas の4指標(Faithfulness, Answer Relevancy, Context Precision, Context Recall)を用いて検索と生成それぞれの品質を分離して評価し、PythonとOpenAI APIを組み合わせてデータセットを採点・可視化し、CI/CDに組み込める形の評価パイプライン構築が「攻めるための守り」として重要だと述べている。
本記事は、RAGの精度はEmbeddingによるベクトル検索だけでなく検索戦略に大きく依存し、セマンティック検索とBM25などのキーワード検索を組み合わせるハイブリッド検索によって、固有名詞や専門用語を含むクエリでRecallとPrecisionをより良く両立できることを実データ検証を通じて示している。
MCP
著者はPlaywright MCPを通じて、ブラウザ自動化の中心がDOMやスクリーンショットからアクセシビリティツリー(ARIA Snapshot)というLLM向け表現へ移行していると指摘する。 従来のPlaywrightは確定フローの堅牢な自動テストに、Playwright MCPは探索的テストやAIエージェントによる操作に適しており、両者を補完的に使う新しいワークフローが提案されている。
論文・その他
社内規程を題材にRAGの失敗パターン(暗黙的参照、マルチホップ推論、例外規定の埋没、否定クエリ)を意図的に含むデータセットで検証し、チャンキング戦略を比較したところ、2000文字のLargeチャンクがもっとも効果的で精度を73.3%から100%に改善した一方、Re-rankingはRecall不足ゆえに精度を悪化させたと分析している。今後はヘッダーベースチャンキングやクエリ拡張、文書前処理など、データ品質と検索精度の向上が重要と結論づけている。
感想:
チャンクを大きくした方が精度が上がるというのは、今の自分の感覚に合っている。以前はLLMのコンテキストウィンドウが小さかったので、小さなチャンクに分けることが正義だったが、今はLLMのコンテキストウィンドウが大きくなったので、大きなチャンクにしてLLMが文脈を理解できるようにした方が精度が上がるのだろう。Gemini 3のような大きなコンテキストウィンドウを持つモデルでは、そもそもチャンク分割が必要なのかという話にもなりそう。
本記事は、Claude Code・Codex・Geminiの3つのLLMコーディングエージェントが生成するコードの「再現性」を、300プロジェクトで検証した研究の解説です。
研究では、クリーンなUbuntu環境上で「依存関係を含めてそのまま動くか」を指標に評価したところ、追加作業なしで動作したのは全体の68.3%にとどまり、約3件に1件は実行に失敗しました。 言語別にはPythonが89.2%と高成功率だった一方、Javaは44.0%と低く、JavaScriptはその中間でした。 失敗原因の過半数は依存関係ではなくコードそのもののバグであり、依存パッケージの記載漏れが直接の原因だったのは10.5%に過ぎませんでした。 さらに、宣言された依存関係の数と実行時に実際にロードされたパッケージ数には平均13.5倍ものギャップがあり、推移的依存関係がバージョン管理されていないリスクが指摘されています。 またエージェントごとに得意領域があり、GeminiはPythonで100%成功、ClaudeはJavaで80%と高く、用途や言語に応じたツール選択の重要性が示されています。 AIコード生成は生産性向上に寄与する一方で、約3割は追加デバッグ(1件平均15分)が必要となる「見えないコスト」があり、人間による確認と修正を前提とした運用が不可欠だと結論づけています。
感想:
体感的にも妥当な調査結果だと思う。
スタンフォード大学HAI研究所は、2026年のAIは「何ができるか」より「どれだけ役に立つか」を評価する段階に入り、AGIはなお実現しないと予測している。 各国では自国のデータと計算資源を守る「AI主権」への関心が高まり、投機的なデータセンター投資を含むAIバブルへの警戒も強まる。 生産性向上は一部領域に限定され、多くのAI導入は期待外れに終わる可能性があり、企業は適用領域の選別を迫られる。 また巨大モデル偏重から高品質データ重視へと軸足が移り、医療や法務、経済では説明可能性や実際の成果指標に基づく「測るAI」が重視され、人間の思考や成長をどう補完するかという人間中心設計が問われると結論づけている。
感想:
妥当なラインだと思う。
カリフォルニア州で2026年1月1日から、最先端AIモデルを開発する企業に対し、「壊滅的リスク」への対応計画の公開や重大インシデント発生時の15日以内の当局報告、内部告発者保護などを義務付ける新AI規制法が施行された。 ここでいう壊滅的リスクは50人以上の死傷や10億ドル超の物的損害などを指し、AIの暴走や兵器開発支援などへの懸念から、専門家や団体が強い安全対策と開発の一時停止を求めている。
クラウド
データーセンター
AIデータセンター需要の急増で送電網がボトルネックとなり、クラウド各社は「BYOG(自家発電)」にシフトしています。xAIやOpenAI、Oracleなどは、ガスタービン、レシプロエンジン、燃料電池を組み合わせたオンサイトのガス発電設備を構築し、グリッド増強を待たずに大規模GPUクラスターを早期稼働させています。これらの方式はコストや効率、導入スピード、冗長性に一長一短があり、AIラボは「1日でも早く稼働させることによる機会利益」と比較して投資判断を行っています。結果として、環境負荷や規制、TCOといった懸念を抱えつつも、AIブームがオンサイトガス発電の巨大な新市場を生みつつあるという構図です。
感想:
最近のDCの消費電力量を考えると自家発電化は必然の流れになりますよねと。ただ、現状選択されている技術はあまり効率も良くなく、環境負荷も高いので、将来的な持続可能性は疑わしい。今度は北米のNG供給網が問題になっていくのではと言う気がしますね。
トランプ政権なので、シェールガスの採掘自体には制限はかからないのかもしれないが、パイプラインの増強などは簡単には進められない。
ネットワーク
2025年はランサムウェア被害が多発し、その主要な侵入経路としてVPN機器、とりわけ脆弱性が頻発するSSL VPNが大きなリスク要因であることが明確になった年だった。
アサヒグループHDのケースなどを契機に、VPN廃止とゼロトラスト/ZTNAへの移行機運が高まり、FortinetもSSL VPN提供終了とIPsecへの移行方針を表明した。
短期的にはVPN機器の脆弱性情報の把握と迅速なパッチ適用、多要素認証や監視強化が必須であり、2026年もインフラ全体の設計見直しとセキュリティモダナイズが重要テーマになると論じている。
エンジニア
AIとお仕事
コードレビューにAIを「第三者」として介在させることで、感情的対立や忖度、好みの衝突を和らげつつ品質を高めようという提案の記事です。 経験別に、ジュニアにはレビュー観点を教える家庭教師、中堅にはコンテキスト理解と抜け漏れ防止を支援する副操縦士、シニアにはきつい指摘をマイルドにする翻訳家としてAIを位置づけ、CodeRabbitなどの自動AIレビュー導入も勧めています。 同時に、機密情報の扱いと最終判断を人間が行う重要性も指摘しています。
AIツールで非エンジニアが立ち上げたReact/TypeScript製プロダクトに1人目エンジニアとして参加し、「動くが古い書き方」「any乱用」「デッドコード」「肥大化コンポーネント」などの技術的負債を、機能開発やバグ修正と並行して小さなPRを積み重ねつつ削減した記録です。AI向けのコーディング規約を整備し、「壊さないこと」を最優先に型整理・ロジック分離・不要コード削除を進めることで、AIと人間が協働できる開発基盤を築いた点を成果としています。
感想:
言い方は悪いかもしれないが、こう言うのもAIに油を差す仕事なのよね。
『問題処理入門』は、仕事における「問題の発見・選定・解決」の基本知識を体系的にまとめた入門書です。
理想と現状の把握から重要な問題の選定方法、複雑性や再発性に応じた解決プロセス、再発しない/再発する問題それぞれの手順を解説する。
さらに、よくあるアンチパターン(解決策から入る、事実と解釈の混同、優先順位無視、費用対効果無視など)を整理し、問題定義を支援するツールも提供している。
エージェントAIによる効率化が進む一方で、人は「所有感」や学びの場を失い、仕事が虚無的に感じられるようになっていると論じる文章です。 AIは雇用だけでなく、エントリーレベルの経験や「面倒くささの中で成長する機会」を奪い、残るのは低賃金で楽しくない対人サービスや、実感の持てない抽象労働になりつつある。 娯楽で紛らわせても格差や不満は解消されず、むしろ攻撃性を増幅させることもあるため、「楽しませてもらう」だけでなく、時間をかけるほど価値が増す人間関係や公共的な行為といった「加算時間価値」のある活動に自覚的に時間を投じるべきだと結論づけている。
感想:
AIによるディストピアを避けるためには、人間関係を構築し、維持するという「面倒」を引き受ける必要がある。
OS
Linux
DockerコンテナーはホストのLinuxカーネルを共有して動作するため、トラブル対応にはLinuxの基礎理解が不可欠であることを解説した記事です。 権限管理、ネットワーク確認、ログ解析、Namespace・cgroups・OverlayFSといったDocker固有技術までをカバーし、段階的な学習ロードマップでDockerエンジニアに必要なLinuxスキル習得の道筋を示しています。
macOS
GitHubリポジトリのCIステータスやIssues、PR、リリース、トラフィック、活動ヒートマップなどをMacのメニューバーから素早く確認できる**「RepoBar」**がリリースされた記事です。
RepoBarはGitHub認証するだけで利用でき、Homebrew(brew install --cask steipete/tap/repobar)や公式サイト、GitHubリポジトリから入手可能で、macOS 15 Sequoia以降のIntel/Apple Silicon Macに対応しています。
PNG圧縮ツール「Pngyu」が約12年ぶりにアップデートされ、Qt6採用によりmacOS 13 Ventura以降〜macOS 26 Tahoeで動作し、pngquantを用いた一括圧縮やプレビュー等を利用可能になりました。
ウクライナのSoftware AmbienceがMac用ストレージユーティリティ「DaisyDisk」をv4.33にアップデートし、macOS 26 Tahoe向けにLiquid Glassなどの新アイコン追加やマテリアル対応、Tahoe関連の不具合修正、隠し領域やFAT32/exFATの容量推定精度向上、ThreadsなどSNS共有対応追加など、多数のバグ修正と性能改善を行ったことを伝える記事です。
その他
トヨタは静岡県裾野市の旧東富士工場跡地に実証都市「Toyota Woven City」を整備し、第1期エリアを2025年9月に開業しました。
自動運転EVやセンサー付きインフラを備え、研究者「インベンターズ」が住民「ウィーバーズ」から行動データやフィードバックを得る都市実験が進行中です。
第1期では約300人、第2期も含め将来は約2000人が居住可能となる計画で、2026年度から住民と来訪者を増やし本格稼働し、旧工場建屋を改修した開発拠点「Woven Inventor Garage」も2026年内完成を目指しています。
ソフトバンクグループはOpenAIへの追加出資225億ドルを完了し、外部投資家分と合わせた総投資額は約410億ドルとなり、OpenAI株の約11%を保有するに至った。

