「AIの自動化に失敗する会社が見落としている『評価』の問題と、それに応えるERC-8004を、ビジネス視点で解説します。」
はじめに:なぜ今「AIの評価」が論点になっているのか
ここ数年、AIは「ある意味なんでもできる」という期待とともに語られてきました。いわゆるAIバブルです。しかし現場で実際に導入を進めてみると、多くの企業が自動化につまずいています。
理由はシンプルで、AIの出力には不確実性があるからです。同じ入力でも結果がぶれる、それっぽいけれど間違っている、という性質を持つAIを、人手を介さず業務に組み込むのは想像以上に難しい。
その結果、いま注目が移りつつある論点があります。それは「AIに何ができるか」ではなく、「AIの出力をどう評価するか」 です。出てきた答えが信頼に足るのかを判断する仕組みがなければ、自動化は前に進みません。
そしてこの論点は、もう一段先の未来とつながっています。
自律して、外部のAIとも協力し合う時代
SalesforceのAgentforceやMicrosoftのCopilot Studioなど、マルチエージェントが実際の現場で浸透してきている現代において、これからのAIは、人間が一つひとつ指示を出す道具ではなく、自分で判断し、必要なら外部のAIに仕事を頼み、成果物を受け取って次に進む — そんなオーケストレーション/ マルチエージェント的な仕様が当たり前になっていくのではと筆者は考えます。
ここで重要なのは「外部の」という部分です。社内で組むAIだけで完結するのではなく、他社が公開しているAIやツールと協力するようになります。たとえば社内の業務AIが、決済はA社のAIに、与信チェックはB社のAIに、というように仕事を振り分けて連携する世界です。
この世界では、新しい問いが生まれます。
たくさんのAI関連サービスが世の中に公開されている中で、独自のAIサービスが他社のAIサービスとどう違うのかを、どうやって相手に伝え、選んでもらうのか?
AI同士が自律的に協力する時代には、「自社のAIサービスの強みを表現し、信頼してもらう」ことが、これまで以上に競争力に直結するのです。
必要なのは「すぐに発見できて、安全確認できる」共通の場
AI同士が協力するには、前提として相手を見つけられることが欠かせません。さらに、見つけた相手が信頼に足るかを安全確認できることも必要です。
つまり、こういう「媒体(プラットフォーム)」が欲しくなります。
- ジョブ(仕事)に応じて、外部公開されているAIエージェントやAIツールをすぐ発見できる
- 見つけたAIが安全か・信頼できるかをその場で確認できる
ところが現状、AI同士のやり取りを担う代表的な仕組み(GoogleのA2AやAnthropic発のMCPなど)は、「どう会話するか」「何ができると名乗るか」は扱えても、「どこにいるAIを、どう信頼するか」という発見と信頼の部分はカバーしていません。ここがぽっかり空いていたわけです。
ここで再注目される Web3
この「発見」と「信頼」の土台として、いま改めて注目されているのが Web3(ブロックチェーン) です。
ビジネス目線でのポイントはこうです。
- 共通の規格でAIを台帳に紐づけることで、世界中のAIに関する公開情報を、一度に・同じ粒度で取得できる
- 誰か一社が管理する閉じたデータベースではなく、改ざんしにくく、特定企業に依存しない形で情報が残る
「同じフォーマットで、誰でも参照でき、書き換えられた痕跡が残る名簿」と言い換えると分かりやすいかもしれません。これは、これから自律化していくAIエージェントの時代にこそ必要なインフラだ、という見立てです。
そこで登場した ERC-8004(Trustless Agents)
こうした要件に応える規格として、2025年に公開され、世界中で議論されているのが ERC-8004(通称:Trustless Agents) です。MetaMask、Ethereum Foundation、Google、Coinbaseといった顔ぶれの著者が名を連ねている点も、注目度の高さを物語っています。
(本記事執筆時点では、EIPとしてはドラフト段階ですが、すでに2026/1/29時点でEthereumメインネットで稼働を開始し、初めの1ヶ月で45,000を超えるAIエージェントがこちらの規格をもとに登録されています!)
ERC-8004が掲げるゴールは明快です。
事前の信頼関係がなくても、組織の壁を越えてAIエージェントを「発見し、選び、やり取りできる」ようにする。
これを実現するために、ERC-8004は3つの台帳(レジストリ) という形で要件を整理しています。全体像は次のとおりです。
図の見方はシンプルです。中央のブロックチェーンを土台に、3つの台帳がAIエージェントに紐づいています。
- Identity Registry(左上→中央):AIに固有のIDを発行し、すべての起点になる
- Reputation Registry(左):ユーザーからの評判(FB)が積み上がる
- Validation Registry(右):検証者によるチェック結果が記録される
そして他のエージェントは、このブロックチェーンを参照して目的のAIを発見します。では、3つの台帳を順番に見ていきましょう。
① Identity Registry|AIの「身分証」をつくる
まず、AIエージェントごとにポータブルで消されにくい固有のIDを与えます。
ここに、そのAIの概要・スキル・対応領域(ドメイン)・連絡先や接続方法といった情報がぶら下がります。「このAIは何者で、何が得意で、どうつなげるのか」を共通フォーマットで名乗れる、いわばAIの身分証です。
ビジネス的な意味は、独自AIサービスの強みを世界共通の様式で表現できるということ。先ほどの「自社のAIサービスは他社とどう違うのか」を伝える土台が、ここで用意されます。
その強みを図解を交えて話すとポイントは2つあります。NFT(AIのDID)という共通規格でAIを台帳に紐づけることで、(1) 他エージェントから発見する際の起点になり、(2) 台帳上での関連データの紐付け先が明確になります。「閲覧」「譲渡」といった扱いも、NFTの仕組みに乗ることで素早く行えます。
② Reputation Registry|「評判」を証跡として残す
AIの出力は定量化しづらく、カタログスペックだけでは良し悪しが分かりません。そこで効いてくるのが、実際に使ったユーザー・他のAIからの評判(フィードバック) です。
ERC-8004は、この評判を証跡として記録・参照できる仕組みを用意します。評価のスコアやタグが残り、誰でも参照できる。評価する側の信頼性をふるいにかける仕組み(レビュアーで絞り込む等)も想定されています。
ビジネス的な意味は、「実績による信頼」を持ち運べる資産にできるということ。良い仕事を積み重ねたAIは、その評判が証跡として蓄積され、次の取引につながります。口コミが消えずに残り、かつ改ざんしにくい、と捉えると分かりやすいです。
図解と共に先ほどの話をAIに対するニーズとして、このRegistryにある役割を端的に話すと、不確実性が高く質の担保がしづらいAIの出力を、ユーザー自身のFBで補うという発想の元に記録を残すことです。「ここは使いやすい、でもここが…」といった生の評価が台帳に登録され、評判の証跡として積み上がっていきます。
③ Validation Registry|「検証済み」という証跡を残す
評判は人やAIの主観に基づくものですが、それとは別に、システム的に安全性・正しさが担保されているという客観的な裏付けも必要です。
ERC-8004は、第三者の検証者がAIの仕事を独立にチェックし、その結果を証跡として残せる仕組みを用意します。検証の手段は一つに固定されず、再実行による確認や、暗号技術・専用の安全な実行環境を使った検証など、複数の方法から選べる設計になっています。
さらに重要なのが、信頼のレベルを「リスクに応じて」選べるという考え方です。ピザを注文する程度の軽いタスクと、医療診断のような重いタスクでは、求められる信頼の厳しさが違う。ERC-8004は、その温度差に合わせて信頼モデルを使い分けられるようになっています。
まとめると本Registryでは、AIが自律的に協力する、つまり人の意思決定を介さずに協力先のAIの安全性を確認するために、各観点の専門家である検証者がAIの仕事をチェックし、その検証結果を台帳に登録することで、「検証済みである」という客観的な証跡として残すことで対応しています。
ビジネスサイドが押さえておくべき示唆
技術仕様の細部はエンジニアに任せるとして、意思決定に関わる立場として持ち帰るべきポイントを整理します。
| 観点 | これまで | これから(ERC-8004的世界) |
|---|---|---|
| AIの評価軸 | 「何ができるか」 | 「出力をどう信頼するか」 |
| 自社AIサービスの見せ方 | 個別の営業・提案資料 | 共通規格での身分証+評判+検証済み証跡 |
| 連携相手の探し方 | 既存の取引・人脈ベース | 公開台帳から発見し、その場で安全確認 |
| 信頼の根拠 | 契約・ブランド | 改ざんしにくい証跡(評判・検証) |
要点を一言でまとめると、こうなります。
AIが自律して外部とつながる時代、その"証跡"を持っているかどうかが、選ばれるAIと選ばれないAIを分ける。
ERC-8004はまだドラフト段階であり、これがそのまま業界標準になると決まったわけではありません。ただ、「発見」と「信頼」をどう仕組み化するかという問い自体は、AIエージェントが普及するほど避けて通れなくなります。
AIサービスを提供する側であれば、「自社AIサービスの強みと信頼性をどう証跡として残すか」。AIサービスを使う側であれば、「外部AIサービスをどんな基準で選び、安全確認するか」。どちらの立場でも、いま考え始めておく価値のあるテーマです。
まとめ
AIバブルの熱が冷め、「結局どれが信頼できるのか」が問われ始めた今だからこそ、信頼を仕組みで担保するという発想が効いてきます。ERC-8004は、その一つの具体的な形として、AI(エージェント)とWeb3が交わる地点に立っています。
技術の行方を追いながら、自社のAI戦略に「信頼の証跡をどう設計するか」という視点を、ぜひ加えてみてください。
さいごに
私が所属しているSapeetでは、「ひとを科学し、寄り添いをつくる」をミッションに、個性豊かなバックグラウンドを持ちながら、互いにリスペクトし合って働いているエンジニア・コンサルタントがいます。様々な変化が加速度的に生まれ続けている今の時代に、主体的に対応できる仲間たちを募集しています!
「ちょっと話だけ聞いてみたい」でも歓迎です!お会いできることを楽しみにしています!
参考:ERC-8004: Trustless Agents(Ethereum Improvement Proposals)



