今週は「AIが何かを発表した」週ではなく、「AIが実際に動き始めた」週だった。ロボットが服を畳み、エージェントが作業を自律実行し、企業が効果測定なしにAI投資を続ける——現場レベルで着実に変化が起きている。
「AIに作業を任せる」が絵空事でなくなってきた
OpenClawという自律型AIエージェントをAWSが一般提供し始めた。メール管理、Web閲覧、ファイル整理といった「地味だけど毎日確実に時間を奪われる作業」を自動でこなす仕組みだ。
自分もここ数週間、いくつかのAIエージェントツールを試してきた。正直なところ、1年前の段階ではまだ「デモは動くが実務では使えない」という感触が強かった。ところが最近はその印象が変わってきている。精度が上がったというより、失敗したときの挙動が読めるようになってきた——つまり、どこまで任せてどこから自分でやるかの判断がつくようになってきた、という感じだ。
今週注目したのがMicrosoft AI Tour Tokyo 2026のレポートだ。「Copilotで時間の使い方が変わる」という話は以前からあったが、今回の報告では「AIが作業をこなし、人間が思考する」という分業の実例が出てきた。会議の議事録作成、メール返信の下書き、レポートの初稿生成——これらを全部AIが処理したうえで、人間はその精度を判断して承認する役割に移行しつつあるという。
これはチャットでAIに質問する段階とは明らかに違う。「聞く道具」から「やってもらう道具」へのシフトが、少なくとも大企業の現場では本格化している。
自分が実感として言えるのは、「作業の委譲」に慣れるのは思ったより時間がかかるということだ。「任せて大丈夫か?」という不安を乗り越えるには、成功体験の積み重ねしかない。AIエージェントを使い始めた人は、まず週3時間以上かかっている繰り返し作業を1つ選んで任せてみることをおすすめする。
ソフト開発AIの「Devin」が日本法人設立——日本市場を狙う理由
コードを自律的に書き、テストし、修正まで行うAI開発ツール「Devin」の開発元が日本法人を設立した。
これは単なる海外企業の日本進出ではないと思っている。日本がターゲットになるのには理由がある。エンジニア不足が深刻で、既存システムの保守コストが高く、内製開発への需要が高まっている——この3つが揃っている市場として、日本は注目されているわけだ。
同時に今週、IBMが「ALSEA」という新ソリューションを発表した。長年の開発知見をAIに参照させることで、大規模システム開発の属人性を下げる狙いがある。「2025年の崖」(多くの企業が2025年頃に老朽化したITシステムの刷新を迫られるという問題)に対応するための打ち手だ。
DevinとIBMのALSEA、アプローチは違うが目指している場所は近い。「人間エンジニアが足りないなら、AIに書かせる」という発想の実用化だ。
ただし自分はここに一つ懸念を持っている。AIが書いたコードを誰がレビューするのか、という問題だ。AIが量産したコードの品質を人間が担保できなくなる状況は、むしろリスクを増やす可能性がある。技術そのものより、運用設計の方が重要な局面に入ってきた気がする。
ロボットが服を畳む時代——「できる範囲」が急拡大している
SB Intuitionsが、Tシャツを自律的に畳める2本のロボットアームの動画を公開した。1枚約40秒。これ単体を見ると「遅い」と思う人もいるかもしれないが、自分はこのニュースの本質は速度ではないと思っている。
重要なのは「形が決まっていないもの」を扱えるようになってきたことだ。Tシャツは折るたびに形が変わる。箱や部品のように規格が固定されたものを扱うのとは難易度が全然違う。柔らかくて不定形な物体を認識して、適切な力加減で操作する——これは数年前まで「ロボットが最も苦手とする領域」と言われていたものだ。
トヨタのバスケロボ新型「CUE7」も今週初披露された。シュートの成功は話題になっているが、個人的により気になるのは「人間らしい動的な振る舞い」という部分だ。静止状態での精度より、動きながら判断する能力の方がずっと難しい。ここに進歩があるとすれば、製造・物流・介護など、静止した環境では使えなかった領域への展開が近づいていることを意味する。
実用化の時間軸はまだ読めないが、方向性は明確だ。物理空間でのAI活用は、ここ1〜2年で一段階レベルが上がっている。
AI投資の判断基準が変わった——「ROI不明でも続ける」が6割を超えた意味
KPMGの調査結果が今週出た。企業の6割超が「ROI(投資対効果)が測定できていなくてもAI投資を継続する」と回答し、半数が年間1億ドル超の予算を見込んでいるという内容だ。
この数字、自分はポジティブとネガティブの両面で見ている。
ポジティブな面は、AI投資が「短期的なコスト削減ツール」としてではなく「中長期の競争力の基盤」として位置づけられてきた証拠だということ。インターネット黎明期のウェブサイト投資や、スマホ普及期のアプリ開発と同じ構造だ。効果が可視化される前から動いた企業が、後から見ると優位に立っていた。
ネガティブな面は、ROI測定を放棄したまま投資が膨らむと、どこかで「本当に効いているのか」の検証が失われるリスクがあることだ。「みんなやっているから」でAI投資を積み上げるだけでは、費用が膨らんで実態を伴わない投資になりかねない。
自分が見ているところでは、AI投資で成果が出ている企業の共通点は、ツールを入れる前に「何をAIに任せて何を人間がやるか」を先に決めていることだ。ツール選びより役割定義の方が先というのは、AI以前のシステム導入でも同じ話だが、改めて意識しておく価値はある。
「Claude Mythos」が自律的に攻撃を実行——能力が上がるほど問われるガードレールの話
今週個人的に気になったのが、Anthropicの新しいAI「Claude Mythos Preview」がネットワーク攻撃を自律的に実行できることをイギリス政府機関のテストが確認した、という報告だ。
AIの能力が上がるということは、「良いことに使える能力」と「悪いことに使える能力」が同時に上がるということだ。これは分離できない。
AWSが一般提供を始めたOpenClawの説明にも「セキュリティ上の考慮が必要」という注記がある。自律的に動けるエージェントは、正しく設定されなければ予期しない動作をする可能性がある。
今週のセキュリティ関連で言えば、Adobe Acrobat/Readerのゼロデイ脆弱性(修正プログラムが出る前から悪用が確認されている脆弱性)も出た。PDFを開くだけで任意のプログラムを実行される可能性があるため、最新版への更新が急務だ。AdobeのAcrobat/Readerを使っている人は、今すぐバージョン確認をしてほしい。
AIの自律性が高まる局面で、セキュリティの重要性も同じ速度で高まっている。エージェントに何かを任せる前に、そのエージェントがどこまでのアクセス権を持っているかを確認する習慣は、これから絶対に必要になる。
今週全体を俯瞰すると、「AIが何ができるか」の議論が落ち着いて、「AIをどう安全に実装するか」「どう組織に組み込むか」という段階に入ってきた印象がある。発表フェーズから運用フェーズへのシフトだ。
来週以降、注目したいのはDevinの日本での受け入れ方と、AIエージェントのセキュリティ基準がどこまで整備されるか。能力の進化と同じ速度で、ガードレールの議論も進んでほしいと思っている。