State of AI Report 2025(Air Street Press)
Research(AI駆動型の生命科学・物質科学と研究プロセスの変革)
(主にP55-63の内容)
AIが**「生命」や「物質」という、これまで人間が理解し、操作するのに膨大な時間と労力がかかってきた領域に、劇的な変化をもたらしている状況を指します。例えるなら、AIが超高性能な「科学探偵」や「錬金術師」、「賢い実験助手」**となって、これまで不可能だった発見を加速し、研究のやり方そのものを根底から変えている、というイメージです。
具体的には、以下の3つの要素で構成されています。
1. 生命科学におけるAI:生命の設計図を読み解き、創造する
AIは、DNAやタンパク質といった生命の基本要素を「言語」のように扱い、その法則を理解したり、新しいものをデザインしたりする能力を獲得しています。
-
分子の「繋がり方」を理解するAI (ATOMICA, ページ56):
- 私たちの体の中では、タンパク質やDNA、小さな分子などが複雑に結びつき合って機能しています。
ATOMICAというAIは、これらの分子がどのように「接合」し、お互いに影響し合っているかを全原子レベルで学習します。 - このAIは、まるで「分子の接合マニュアル」を読めるようなもので、病気と関連する分子の組み合わせを見つけたり、まだ知られていない薬の結合場所を予測したりします。これにより、新しい薬の開発や病気のメカニズム解明に役立ちます。
- 私たちの体の中では、タンパク質やDNA、小さな分子などが複雑に結びつき合って機能しています。
-
DNAの「言葉」を読み解くAI (Evo, ページ62):
-
EvoというAIは、DNAの配列をまるで文章のように学習します。DNAの膨大なデータから、生物学的な意味のあるパターンや依存関係を見つけ出すのです。 - これは、DNAが持つ「生命の設計図」という言葉をAIが理解しようとしているようなもので、病気の原因となる遺伝子の特定や、新しい生物学的機能の発見につながります。
-
-
タンパク質の「設計図」を描くAI (ProGen3, ページ63):
- タンパク質は生命活動の主役ですが、その機能は複雑な立体構造に依存します。
ProGen3というAIは、タンパク質の配列データを学習し、まるで新しい文章を書くように、これまでになかった新しいタンパク質を生成する能力を持っています。 - これは、AIが「新しいタンパク質」という、人間では思いつかないような生命の部品をデザインできるようになることを意味し、新薬や新素材の開発に革新をもたらす可能性を秘めています。
- タンパク質は生命活動の主役ですが、その機能は複雑な立体構造に依存します。
2. 物質科学におけるAI:新しい素材を生み出し、化学反応を最適化する
AIは、原子レベルでの物質の振る舞いを予測したり、望ましい性質を持つ新素材を設計したり、複雑な化学実験を自動化したりしています。
-
原子の「気持ち」を予測するAI (UMA, ページ57):
- 物質の性質は、原子同士がどのように力を及ぼし合っているかで決まります。これまで、これを正確に計算するには、膨大な時間とスーパーコンピューターが必要でした。
-
UMAというAIは、この原子間の力を非常に高速かつ正確に予測できます。これにより、AIが「原子の気持ち」を瞬時に理解できるようになり、これまで想像もできなかったような大規模なシミュレーションが可能になり、新素材の探索が劇的に加速します。
-
「夢の素材」を直接デザインするAI (MatterGen, ページ58):
-
MatterGenというAIは、まるで創造主のように、望む性質(例えば、特定の電気的特性や磁気的特性)を持つ新しい無機結晶の構造を、直接「生成」することができます。 - これは、AIが「こんな機能を持つ素材が欲しい」という人間からのオーダーを受けて、その設計図を自ら生み出すようなもので、新素材開発のプロセスを根本から変え、画期的な材料の発見を可能にします。
-
-
化学戦略を立てるAIと、実験するロボット (ChemBench, Chemspeed, Rainbow, ページ59-60):
- AI(
LLM)は、複雑な化学合成のルートを考えたり、化学反応のメカニズムを推論したりする能力で、すでに人間(一流の化学者)を凌駕し始めています(ChemBench)。AIは「最高の化学戦略家」になりつつあります。 - さらに、ロボットが自動で実験を計画し、実行し、分析し、次の実験を判断するという「ロボット化学者」(
Chemspeed、Rainbow)も登場しています。人間が1日に数回しかできない実験を、ロボットは1000回以上こなすことも可能です。 - これにより、新薬や新素材の発見に必要な時間とコストが劇的に削減され、開発スピードが飛躍的に向上します。
- AI(
3. 科学研究のための「AIプログラマー」:専門ソフトを自動生成
AIは、特定の科学分野で使われる専門的なソフトウェアや、問題を解決するための新しいアルゴリズム(計算手順)を自ら生み出す能力も示しています。
-
アルゴリズムを進化させるAI (AlphaEvolve, ページ55):
-
AlphaEvolveというAIは、まるでプログラムを編集するプログラマーのように、既存のプログラムを修正したり、新しいアイデアを試したりして、より効率的で優れたアルゴリズムを発見します。 - Google社内では、これによりリソースの節約や処理の高速化に貢献した実績もあり、AIが「科学計算の新しいやり方」を自ら生み出す時代が来ています。
-
-
専門家レベルの科学ソフトウェアを作るAI (LLM-driven tree search, ページ61):
-
LLM(大規模言語モデル)は、単に文章を書くだけでなく、科学的な問題を解決するための「専門的なプログラムコード」を生成できるようになりました。 - 例えば、病気の診断に関わるデータ解析、複雑な数学的な計算、気象予測など、様々な分野で、AIが生成したプログラムがこれまでの最良の手法を上回る成果を出しています。AIは「あなたの代わりに研究ツールを開発してくれる賢いプログラマー」なのです。
-
このように、「AI駆動型の生命科学・物質科学と研究プロセスの変革」とは、AIが生命と物質の根源に迫り、新しい発見を次々と生み出し、これまで人間が行ってきた研究の「やり方」を、より速く、より正確に、そしてよりクリエイティブに変革している、最先端の科学革命のことなのです。
Q:ページ60のRobot chemistsの事例が興味深いです。詳しく解説してください
A:
「Robot chemists scale discovery at 10x human speed and 1,000 experiments per day」(ロボット化学者が発見を10倍の人間速度と1日1,000実験の規模で加速する)という内容について、詳しく解説します。これは、AIとロボット技術が融合し、化学研究のやり方を根本から変えつつある非常に興味深い事例です。
ロボット化学者とは何か?
「ロボット化学者」とは、AIの知能とロボットの物理的な操作能力を組み合わせ、化学実験の計画、実行、分析、そして次の実験の決定までを、人間を介さずに自律的に行うシステムのことです。
例えるなら、これまで人間の化学者が研究室で行っていた一連の作業(フラスコを混ぜる、試薬を測る、結果を分析する、次の実験を考える)を、AIが頭脳となり、ロボットが手足となって、**すべて自動で行う「AI研究員」**のような存在です。
核心:クローズドループによる自律的な発見
このロボット化学者の最大の強みは、「クローズドループ(閉じたループ)」で実験を進められる点です。
- 計画 (Plan): AIが目的(例:最も明るい量子ドットの作成)に基づいて、次に試すべき条件(試薬の種類、量、温度など)を計画します。
- 実行 (Execute): ロボットが、その計画に従って実際の化学反応を行います。試薬を混ぜる、加熱する、特定の時間にサンプルを採取するなど。
- 分析 (Analyze): ロボットに接続された分析機器(分光器、質量分析器など)が、生成物の特性や反応の結果を自動で測定・分析します。
- 決定 (Decide): AIがその分析結果を評価し、目標にどれだけ近づいたか、次に何を試すべきかを判断します。
- 繰り返す: このループを高速で繰り返すことで、人間が何週間もかかるような最適条件の探索を、ロボットは短時間で効率的に行います。
注目すべき具体的な事例
論文では、この分野をリードする2つの大学からの研究事例が紹介されています。
1. リバプール大学のシステム
- 目的: 合成、超分子アセンブリ(分子が自発的に組織化するプロセス)、光化学(光を使った化学反応)といった多様な化学プログラムを実行すること。
-
構成:
-
Chemspeed合成装置: ロボットアームが試薬を正確に計量し、反応容器間で移動させて、多様な合成反応を実行します。 -
UPLC–MS(超高速液体クロマトグラフィー質量分析計): 反応で生成された物質を高速で分離し、その質量と組成を分析します。 -
ベンチトップNMR(核磁気共鳴装置): 分子の構造を詳細に解析します。
-
-
自律性:
- モバイルスケジューリング、サンプル追跡、再補充: ロボットが実験の進行状況を管理し、必要な試薬が少なくなれば自動で補充する仕組みも備えています。
- 意思決定: 複数の分析機器から得られたデータ(マルチインストゥルメントの読み出し)に基づいて、どの反応が最も有望かをランク付けし、専門家の選択と一致するような次の実験(フォローアップ)を自律的に選択します。
- 24時間稼働: 人間が休憩する夜間でも実験を継続し、効率を最大化します。
- 成果: 複雑な化学合成や研究プロセスにおいて、人間と同等かそれ以上の意思決定品質を保ちながら、実験を高速で進めることを可能にしました。
2. ノースカロライナ州立大学の「Rainbow」システム
- 目的: 量子ドット(非常に小さい半導体ナノ粒子で、ディスプレイや医療応用が期待される)の最適なレシピを探索すること。量子ドットの品質は、その明るさや色の純度で評価されます。
-
構成:
- 液体ハンドラー: 精密に液体を扱うロボット。
- 並列マイクロリアクター: 多数の反応を同時に、かつ少量で行える装置。
- ハンドリングアーム: サンプルを装置間で移動させるロボットアーム。
- インライン分光法: 反応中にリアルタイムで生成物の特性を測定する装置。
- アクティブラーニングプランナー: AIの一種で、過去の実験結果から次にどの条件を試すべきかを賢く選択する「頭脳」の部分です。最も効率的に目標に到達するための実験計画を立てます。
-
自律性:
- 大規模探索: 量子ドットの性質に影響を与える可能性のあるリガンド(配位子)、溶媒、塩といった様々な要素を大規模に探索します。
- 構造-特性関係の学習: どの条件がどのような結果(明るさ、色純度)をもたらすかを学習し、化学構造と物質の特性の間の関係をAIが理解します。
- パレートフロントの追跡: 複数の目標(明るさと色純度など)がある場合、それらを両立させる最適な解の集合(パレートフロント)を効率的に見つけ出します。
- 成果: 約24時間以内に、クラス最高(best in class)の量子ドットのレシピに到達しました。人間が手作業で行えば、数週間から数ヶ月かかるような探索を、わずか1日で完了させたことになります。
なぜこれが画期的なのか?
- 10倍のスピード: ロボットは疲れないため24時間稼働でき、人間よりもはるかに速く、正確に実験を実行できます。論文では「人間の10倍の速度で、1日1,000以上の実験」が可能になったと強調されています。
- 発見の加速: この圧倒的な実験回数とスピードにより、新薬や新素材、より効率的な反応条件の発見が劇的に加速されます。
- 人的リソースの解放: 研究者は、単純な繰り返し作業から解放され、より創造的な思考や、AIが見つけた新しい現象の解明といった、人間でしかできない高度なタスクに集中できるようになります。
- 再現性と精度: ロボットは常に同じ条件で精密に作業を行うため、実験の再現性が高く、データの信頼性が向上します。
ロボット化学者は、まさにAIとロボットが科学研究の現場で強力なパートナーとなり、人類の知識発見の速度を飛躍的に向上させる未来を現実のものとしつつある、最先端の事例と言えるでしょう。
Q:AlphaEvolveについて詳しく説明してください
A:
AlphaEvolveとは何か?
AlphaEvolve は、DeepMind が開発した進化的なコーディングエージェントです。これは、AIが自らプログラムのコードを繰り返し編集し、テストし、評価の高いものを次の世代の基盤として採用していくことで、新しいアルゴリズムや既存のアルゴリズムの改善案を自律的に発見するシステムです。
簡単に言えば、AlphaEvolve は**「自分でコードを書いて、自分でテストして、より良いコードを自動で進化させていくAIプログラマー」**のようなものです。
どのように動作するのか?(進化のプロセス)
AlphaEvolve の名前にある「Evolve(進化)」が示す通り、その動作原理は自然界の「進化」のメカニズムに似ています。
-
プログラムの変異 (Mutation):
- まず、AIは既存のプログラムコード(あるいは、何らかの初期コード)をベースにします。
- 次に、そのコードに対して、まるで遺伝子が突然変異を起こすように、様々な**「編集」**を加えます。これには、コードの行の変更、新しいロジックの追加、既存のロジックの削除、操作順序の変更などが含まれます。これにより、多数の新しい「候補となるプログラム(バリアント)」が生成されます。
-
自動評価 (Automated Evaluation / Fitness Function):
- 生成されたそれぞれの候補プログラムは、**「自動化された評価器(automated evaluators)」**によってテストされます。この評価器は、プログラムがどの程度目標を達成できているか(例えば、計算の速さ、正確さ、消費リソースの少なさなど)を客観的に数値化します。
- この評価は、自然淘汰における「環境への適応度(fitness)」に相当します。**重要な点として、論文ではこの評価/適応度関数は「エンジニアによって依然として定義される」**と述べられています。つまり、AIが進化する方向性は、人間が設定した評価基準によってガイドされるということです。
-
最適なバリアントの昇格 (Promotion of Best Variants):
- 評価の結果、最も高いパフォーマンスを示した「最良のバリアント」が選ばれ、「昇格(promote)」されます。
- これらの「勝ち残った」プログラムが、次の世代の変異と評価のサイクルにおける新たな出発点となります。
-
繰り返しのサイクル (Iteration):
- この「編集 → 評価 → 選択」のサイクルが何千、何万回と繰り返されることで、プログラムは徐々に、そして最終的には劇的に、性能を向上させたり、人間では思いつかなかったような新しい解決策へと「進化」していくのです。
AlphaEvolveのインパクトと成果
AlphaEvolve は、その進化的なアプローチによって、数々の驚くべき成果を上げています。
-
新しい行列乗算アルゴリズムの発見:
- コンピュータサイエンスの基本的な問題の一つである行列乗算において、4x4の複素数値行列を乗算する際に、これまでより少ない48回のスカラー乗算で済む新しいアルゴリズムを発見しました。これは、1969年に発表された
Strassenのアルゴリズムを上回る画期的な改善であり、理論的なインパクトが非常に大きいです。
- コンピュータサイエンスの基本的な問題の一つである行列乗算において、4x4の複素数値行列を乗算する際に、これまでより少ない48回のスカラー乗算で済む新しいアルゴリズムを発見しました。これは、1969年に発表された
-
数学のオープン問題への応用:
- 数学における50のオープン問題(未解決問題や最適解が不明な問題)のセットに対して適用されたところ、75%のケースで既存の最先端(SOTA)の解法を再発見し、さらに20%のケースでは既存の解法を改善する結果を達成しました。これは、AIが数学的な発見能力を持つことを示唆しています。
-
Google社内での実用的な貢献:
-
Googleの実際のプロダクション環境においても、AlphaEvolveが発見した改善策が導入されました。これにより、**0.7%のリソース回収(計算資源の節約)や、より高速なカーネル(低レベルな計算処理)**が実現され、具体的なエンジニアリング上の利益をもたらしています。
-
-
「超人的な科学的知識」の生成:
- これらの成果は、
AlphaEvolveが**「新規性があり、検証可能で、人間を超える科学的知識を生み出すAIシステム」の具体的な例**であると結論付けられています。
- これらの成果は、
なぜこれが重要なのか?
AlphaEvolve は、AIが単に人間が書いたコードを実行するだけでなく、自ら「創造的な」プログラミングを行い、新しいアルゴリズムや最適化手法を発見する能力を持つことを示しました。これは、ソフトウェア開発、科学計算、そしてAI研究そのものの効率と発見の速度を劇的に向上させる可能性を秘めています。人間のプログラマーや研究者が設定した目標に対して、AIが自律的に解決策を「進化」させていくという、非常に強力なパラダイムシフトを示すシステムと言えるでしょう。
Q:LLM-driven tree searchの内容を詳しく説明してください
A:
ページ61で紹介されている「LLM-driven tree search writes expert-level scientific software across domains」という内容について、詳しく説明します。
LLM-driven tree search とは何か?
これは、大規模言語モデル(LLM)の強力な言語理解・生成能力と、効率的な探索アルゴリズムであるツリー探索(Tree Search)を組み合わせることで、専門家レベルの科学ソフトウェアを自動的に生成・改善していくシステムです。
簡単に言えば、AIが**「科学論文を読んで問題を理解し、それらを解決するプログラムコードを自ら書き、実験し、失敗したら改善し、最終的に既存の最高性能を超える」**という一連の研究開発プロセスを自動で行う、というシステムです。
どのように動作するのか?
このシステムは、いくつかの重要なコンポーネントが連携して動作します。
-
LLMによるコード生成・アイデア提案:
- システムの中核には、非常に高性能な
LLMがあります。このLLMは、科学的な問題やタスク(例:単一細胞RNAシーケンスのデータ解析、特定の数学関数の数値積分など)を理解します。 - その上で、「コードの生成」を行います。これは、既存のアイデア(例えば、過去の研究で使われたアルゴリズムの一部)を組み合わせたり、あるいは
LLM自身の「創造性」によって「新しいアイデア」を提案したりする形で行われます。この部分は、まるでAIが複数の研究論文を読み解き、そこから新しい仮説や実験手法を考案するようなものです。
- システムの中核には、非常に高性能な
-
修正されたツリー探索("code mutation system"):
-
LLMが生成したコードやアイデアは、ツリー探索というアルゴリズムによって効率的に管理され、評価されていきます。ツリー探索は、多数の可能性の中から最適な解を見つけるための探索手法で、チェスやGoなどのゲームAIでよく使われます。 - ここでは特に「コード変異システム(code mutation system)」という形でツリー探索が使われます。これは、
LLMが生成したコードに対して、小さな変更(変異)を加えたり、異なるアイデアを組み合わせたりしながら、候補となる多数のコードバリアントを系統的に探索していくことを意味します。
-
-
実行と厳密な評価:
- 生成された個々のコードバリアントは、実際に実行されます。
- そして、その実行結果は、**「公開されているベンチマーク(public benchmarks)」**で厳密に評価されます。これは、その分野で客観的に性能を測るための標準的なテストセットです。
- 評価は非常に厳しく行われ、どのコードが最も高いスコアを出したかが明確に測定されます。
-
反復と改善:
LLM-driven tree search のインパクトと成果
このシステムは、単一の分野にとどまらず、非常に幅広い科学ドメインで驚くべき成果を上げています。
-
単一細胞RNAシーケンス統合ベンチマーク (OpenProblems):
- 細胞レベルでの遺伝子発現データを解析するこの難しいタスクにおいて、システムが生成した87種類のメソッドのうち40種類(既存アイデアの組み合わせや、AI独自のアイデアを含む)が、既存のリーダーボードに掲載されている全ての公開エントリーを上回る性能を示しました。これは、AIがこの分野で新しい最先端の手法を発見したことを意味します。
-
数値積分:
- 数学の数値積分(特定の関数の面積を計算するタスク)において、システムが生成したアルゴリズムは、難しい19個の積分問題のうち17個で3%以下の誤差で成功しました。これに対し、広く使われているPythonの科学計算ライブラリ
scipy.integrate.quad()は、これら19個全てで失敗しました。 - AIの解決策は、「適応的ドメイン分割(adaptive domain partitioning)」と「オイラー級数加速(Euler series acceleration)」という高度な数学的手法を組み合わせたものでした。
- 数学の数値積分(特定の関数の面積を計算するタスク)において、システムが生成したアルゴリズムは、難しい19個の積分問題のうち17個で3%以下の誤差で成功しました。これに対し、広く使われているPythonの科学計算ライブラリ
-
COVID-19予測:
- 米国のCDC(疾病対策センター)の
COVID-19 Forecast Hubという、感染症予測の競争に参加し、既存の強力な時系列モデル(AR、GBM)やメカニスティックモデル(病原体の伝播メカニズムに基づくモデル)と同等か、それらを革新するような成果を出しました。
- 米国のCDC(疾病対策センター)の
-
その他:
- リモートセンシング画像からのセグメンテーション(
DLRSD)など、他のタスクにも適用され、単一分野に限定されない汎用性(breadth beyond a single field)を示しています。
- リモートセンシング画像からのセグメンテーション(
なぜこれが重要なのか?
この LLM-driven tree search システムは、科学的な方法論そのものを自動化する画期的なアプローチを示しています。AIが単にデータを分析するだけでなく、新しい研究手法を考案し、それをコードとして実装し、実験し、評価し、改善するという、人間が行う研究サイクル全体を自律的に回せることを実証しました。これにより、科学的な発見の速度と効率が飛躍的に向上し、これまで人間が数年かかっていたような研究が、AIによって短期間で達成される可能性が生まれています。これは、AIが「科学者」の役割を担い始める時代の到来を告げるものです。
Q:ページ62,63にてScaling lawsについて言及されていますが、詳しく解説してください
A:
スケーリング法則(Scaling Laws)とは何か?
スケーリング法則とは、AIモデルの性能(特に損失やエラー率)が、モデルのサイズ、訓練データの量、計算資源(計算量)といった要素を増やしていくと、予測可能な形で改善していくという経験的な関係性のことです。
簡単に言えば、「AIは、大きくすればするほど、データをたくさん与えれば与えるほど、そしてたくさん計算させればさせるほど、賢くなる。しかも、その賢くなる度合いは、ある法則に従って予測できる」という発見です。
これは、まるで物理学の法則のように、特定のパラメータを増やしたときに結果がどのように変化するかを予測できるため、効率的なAIモデル開発戦略を立てる上で非常に重要な指針となります。
AIのスケーリング法則を構成する主要な要素
スケーリング法則における主要な要素は以下の3つです。
- モデルサイズ (Parameters): モデル内の学習可能な重み(パラメータ)の数。モデルが大きければ大きいほど、より多くの情報を記憶し、複雑なパターンを学習できます。
- 訓練データ量 (Data): モデルに学習させるデータの量。データが多ければ多いほど、モデルは様々な例からより汎用的な知識を獲得できます。
- 計算量 (Compute): モデルの訓練に要する計算資源の量。これには、モデルサイズとデータ量を掛け合わせたものや、訓練のステップ数などが関係します。
これらの要素を増やしていくと、モデルの性能指標(例:言語モデルであればPerplexity (PPLX)、つまり次の単語を予測する際の予測の不確かさ。値が低いほど性能が良い)が、**なめらかに(smoothly)かつ予測可能に(predictably)**改善していくことが、様々な研究で示されています。
ページ62:ゲノミクス分野におけるスケーリング法則(DNAモデル)
ページ62では、DNA配列を扱うAIモデル(ゲノミクスAI)におけるスケーリング法則が紹介されています。
-
Evoモデル:
Evoというモデル(HyenaファミリーやTransformer++/Mambaといったアーキテクチャ)がDNAから生物学的依存関係を学習しています。 -
予測可能な性能向上:
-
データ量: 約3000億のヌクレオチド(DNAの基本単位)という膨大なデータで訓練されています。
Evo-2ではさらにデータ量が増え、9.3兆トークン(DNAの配列断片)までスケールアップされています。 -
モデルサイズ:
Evo-2では、400億パラメータと70億パラメータのモデルが訓練されています。 -
コンテキスト長: モデルが一度に考慮できるDNA配列の長さ(コンテキスト長)も、
Evoでは131k(13万1千)、Evo-2では1M(100万)と非常に長くなっています。
-
データ量: 約3000億のヌクレオチド(DNAの基本単位)という膨大なデータで訓練されています。
-
結果: これらの要素(データ、パラメータ、コンテキスト)を増やすにつれて、DNAの予測タスクにおけるパープレキシティ(PPLX)がスムーズに、そして計算量に基づいて予測可能な形で改善することが示されています。
-
アーキテクチャの効果:
Hyenaファミリーのような特定のモデルアーキテクチャが、Transformer++/Mambaと比較して、より低いPPLX/FLOP(計算効率)を実現し、訓練が安定していることも示されており、モデルの設計も性能向上に寄与することが強調されています。
意味合い: DNAという生命の設計図の言語をAIに理解させる上で、計算資源とデータの投入が直接的にモデルの賢さに繋がる、という明確な指針が得られたということです。これは、ゲノム解析、新薬開発、遺伝子編集など、生命科学の多くの分野に大きな影響を与えます。
ページ63:プロテイン分野におけるスケーリング法則(タンパク質モデル)
ページ63では、タンパク質配列を扱うAIモデル(プロテインLM)におけるスケーリング法則が紹介されています。
-
ProGen3モデル:
ProfluentのProGen3は、タンパク質の言語モデル(PLM)における計算効率と性能の関係(「compute-optimal frontier」)を特定し、その上で非常に大規模なモデルを訓練しています。 -
大規模な訓練:
-
データセット:
PPA-1という34億の全長タンパク質(1.1兆トークン)を含むデータセットで訓練され、最終的には1.5兆トークンものデータで学習されました。 -
モデルサイズ: 460億パラメータの
MoE (Mixture of Experts)モデルまでスケールアップされています。
-
データセット:
-
結果:
- より広い探索空間でのタンパク質生成: モデルサイズが大きくなるほど、より多様で「生存可能(viable)」なタンパク質を生成できるようになります。これは、AIがこれまでにない機能を持つタンパク質をデザインできる可能性が高まることを意味します。
- アラインメントの効果: 人間のフィードバックや特定の目標に沿ってモデルを調整する「アラインメント」が、特に大規模モデルにおいて性能を最も大きく向上させることも示されています。
意味合い: DNAと同様に、タンパク質の設計においてもスケーリング法則が当てはまります。モデルを大きくし、大量のデータで訓練することで、AIはより多くの種類の、そしてより有用なタンパク質を生成できるようになります。これは、新しい酵素、抗体医薬、材料開発など、バイオテクノロジーの進歩に直結します。

スケーリング法則がもたらすインパクト
- AI開発の指針: スケーリング法則は、AI研究開発において「何をどれだけ投資すれば、どの程度の性能改善が見込めるか」という明確なロードマップを提供します。これにより、闇雲な試行錯誤ではなく、効率的かつ戦略的なモデル開発が可能になります。
- 性能予測と限界の理解: 特定のリソース条件下でAIがどこまで賢くなれるかを予測するのに役立ちます。また、現在の技術的限界や、さらなるブレイクスルーに必要な資源量を見積もる上でも重要です。
- AIの「科学」への貢献: これらの法則は、AIの能力が単なる統計的学習を超え、生物学的データのような複雑な領域においても、特定の原理に基づいて振る舞うことを示しており、AIそのものがより科学的な研究対象となっています。
スケーリング法則の発見は、AI研究を「職人の勘」から「科学」へと推し進める大きな一歩であり、現在の高性能AIモデルの多くがこの法則に基づいて設計・開発されています。






