本記事はFastcompanyにより翻訳されたものです。
研究者たちは長年、AIモデルにビデオゲームをプレイさせることで、日常生活で特定のタスクをこなせるように訓練してきました。グーグル傘下のDeepMindは今週、様々な仮想環境をナビゲートする方法を学習できる「ジェネラリスト」AIエージェントをリリースし、AIゲームに関してさらにレベルアップしました。
SIMA(スケーラブル・インストラクタブル・マルチワールド・エージェント)と呼ばれるこのエージェントは、仮想世界の中で自然言語の指示に従ってさまざまなタスクを実行することができます。例えば、資源を採掘する方法、宇宙船を操縦する方法、ヘルメットを作る方法、ビルディングブロックから彫刻を作る方法などを学習し、これらすべてをキーボードとマウスを使ってゲームの中心人物を操作して実行しました。
SIMAを動かすAIシステム(複数のモデルで構成)は、言語を画像に正確にマッピングするように設計されています。ビデオモデルは、エージェントが特定の行動を取った場合に次に何が起こるかを予測するために訓練されました。その後、ゲームに特化した3Dデータでシステムを微調整しました。
最終的には、DeepMindの研究者たちは、現実世界で物事を行う方法を見つけ出すことができるAIモデルやエージェントを構築するためのステップを踏みたいと考えています。DeepMindのリサーチ・エンジニアであるフレデリック・ベッセは火曜日、記者団との電話会見で、「エージェントが見たこともないような環境下での行動こそが、我々が本当に興味を持っている領域なのです」と語りました。
SIMAにはまだまだやるべきことがあります。ベッセ氏によると、ハロー・ゲームズの『No Man's Sky』をプレイした場合、人間の能力の60%程度しか発揮できませんでしたという。「エージェントが失敗するときによく見られるのは、彼らの行動は多くの場合意図的に見えますが、必要な行動を開始できないということです」とベッセ氏は言います。
ディープマインドのリサーチエンジニアでSIMAプロジェクトのリーダーであるティム・ハーレイは、火曜日の電話会議で、この技術の応用について話すのは時期尚早だと強調しました。「我々はまだ、これがどのように機能するかを理解しようとしています...どのように真に一般的なエージェントを作成できるか…」
以上、DeepMindがどんなゲームでもプレイできるエージェントを開発したという情報を伝えました。ほかのAIトレンドに関心を持つ方に、ポートレート写真をアップロードすると、AI 似顔絵を自動的に生成してくれるToongineer、最高なぼかし除去 サイトを目標に働いているVanceAI画像鮮明化という二つのAI製品を試すのをお勧めします。