前回は人文社会科学、今回はバイオインフォマティクス
前回の記事では、文科省 SPReAD1000 のユースケース 「少子化に関する各国文献の AI 横断分析」 を題材に、人文社会科学分野 での AI for Science を実験しました。GraphRAG による文献横断分析システムを Azure 上に設計し、約40分で研究計画・Azure構成・コスト見積もり・統合提案書の一式を生成しました。
今回は バイオインフォマティクス分野 に舞台を移します。同じユースケースイメージから 「タンパク質変異の機能影響予測 AI」 を取り上げ、マルチモーダル深層学習の具体設計に踏み込みます。
前回との違い:
- 前回(人文系): GraphRAG + Azure AI Search → テキスト文献の横断検索・論点抽出
- 今回(バイオ系): ESM-2 + GNN + DMS → タンパク質の配列・構造・機能データを統合する深層学習
分野が変わっても、「知見 × エージェント = 両輪」 というアプローチは同じです。そして今回は、研究実行フェーズを自動化する新たな武器が加わります — 筆者が開発した科学技術者AIエージェント Co-Scientist(202スキル) と、ハーバード大学医学部が開発した AI for Science ツール基盤 ToolUniverse(1,000+ 科学ツール) の掛け合わせです。ドメイン知識を持つ AI エージェント × 世界最高峰の科学ツール群 — この組み合わせにより、従来は数週間かかったデータ収集・前処理・モデル設計を数十分に圧縮できます。
この記事自体が「AI for Science」の実験です
本記事は、人間が書いたものではありません。
筆者が開発した AI エージェント群(SHIKIGAMI / SPReAD1000-Builder / CoreClaw + Co-Scientist)が、ESM・AlphaMissense・PIRATE などの最新 VEP 手法を Web 上で調査し、Azure の GPU 料金ページにアクセスし、筆者開発の Co-Scientist 202 スキルとハーバード大学医学部開発の ToolUniverse 1,000+ 科学ツールを研究フェーズにマッピングし、この記事を執筆しました。 筆者が行ったのは、「タンパク質変異の機能影響予測をマルチモーダル深層学習で」というテーマの提示と、Co-Scientist × ToolUniverse という技術スタックの選定、そしてエージェントとの対話による方向修正です。
つまり、前回に引き続き、この記事の作成プロセス自体が「AI for Science」の実験 です。
- AI エージェントが ESM-2 / AlphaMissense / PIRATE の最新論文を調査する → 文献調査
- AI エージェントが Azure A100 Spot 料金を取得して GPU コストを算出する → 実験
- AI エージェントが Co-Scientist 202 スキルを研究フェーズに自動マッピングする → 研究設計
- AI エージェントが ToolUniverse 経由で UniProt / AlphaFold / gnomAD の API 仕様を確認する → 検証
- その一連のプロセスを記事として出力する → 文書化
前回は人文社会科学、今回はバイオインフォマティクス — 分野を問わず、約40分で設計書一式が完成します。
この記事は誰のためのものか
SPReAD1000 への応募を検討している研究者 の方へ。
前回の記事を読んで「人文系のユースケースはわかったけど、自分の分野(生命科学・バイオインフォマティクス)ではどうなるのか」と思った方もいるのではないでしょうか。あるいは、「深層学習モデルの設計から Azure の GPU 構成まで、自分でゼロから調べるのは大変だ」と感じた方もいるかもしれません。
本記事では、提示されたユースケースの一つ 「タンパク質変異の機能影響予測AI」 を題材に、マルチモーダル深層学習の具体的なアーキテクチャ、Azure GPU コスト、Co-Scientist 202 スキルによる研究自動化パイプライン を設計しました。結論から言うと、SPReAD1000 の予算 ¥500万 / 180日 で、Azure コストはわずか 8%(¥40万)に収まり、予算の大部分は人件費に充当可能 です。
その見通しを、モデルアーキテクチャの層構成から Azure の SKU 名と Spot 料金まで落とし込んでお見せします。
💬 「ChatGPT や Claude に聞けば同じようなものが出てくるのでは?」と思った方へ。
試してみてください。「タンパク質変異の影響予測モデルを作りたい。Azure の構成と料金を教えて」と聞けば、それらしい回答は返ってきます。しかし、「ESM-2 の配列埋め込み + AlphaFold 構造の GNN + DMS 実験データを Cross-Attention で融合する」 という具体的なアーキテクチャ設計は出てきません。「深層学習を使いましょう」という一般論で終わります。
さらに、「A100 の Spot 料金が通常の 60-80% 引きで ¥165-220/hr であること」、「ESM-2 650M の fine-tuning に約 40 GPU 時間が必要なこと」、「筆者開発の Co-Scientist variant-effect-prediction スキルが、ハーバード医学部開発の ToolUniverse 経由で gnomAD API の CADD/REVEL/AlphaMissense スコアを一括取得できること」 — こうした 設計判断を左右する具体的な数値と技術仕様 は、汎用 AI チャットでは正確に出てきません。
本記事では、SPReAD1000-Builder が Azure の最新価格表を実際に参照し、Co-Scientist のスキルカタログと ToolUniverse の API 仕様を突き合わせながら、研究フェーズごとの自動化パイプラインを設計しています。
1. ユースケースの概要
文科省が提示したユースケースイメージ
タンパク質の配列・立体構造・機能構造データを統合し、変異が機能に与える影響を予測する独自のAIモデルを開発。未検証変異の実験候補を優先付けし、検証効率の向上を目指す。
期待される成果
配列・立体構造・機能実験を統合した××万件規模の変異影響予測データセットを整備するとともに、独自深層学習モデル初期版を構築。既存手法・単一データモデル・人手ルールをベースラインとして、予測精度および上位候補の実験ヒット率を比較評価し、有効性を検証する。
本記事で設計した具体的な目標
| 指標 | ベースライン(ESM zero-shot) | 目標値 | 改善幅 |
|---|---|---|---|
| DMS相関 Spearman ρ | 0.45–0.50 | ≥ 0.65 | +33% |
| 病原性分類 AUC-ROC | 0.85 | ≥ 0.92 | +8% |
| 希少変異 AUC-PR | 0.60 | ≥ 0.75 | +25% |
| 推論速度(変異/秒) | 100 | ≥ 500 | 5倍 |
2. なぜ AI が必要か — 変異効果予測の現状と課題
ヒトゲノムには約 20,000 のタンパク質コード遺伝子が存在し、大規模シーケンシングにより 毎年数百万の新規変異 が同定されている。ClinVar データベースでは登録変異の約 48% が VUS(Variants of Uncertain Significance) に分類され、機能的影響が不明のままだ。
既存手法の比較と限界
| 手法 | データソース | 強み | 限界 |
|---|---|---|---|
| ESM-2 zero-shot | 配列のみ(650Mパラメータ) | 追加訓練不要、DMS相関 ρ ≈ 0.45-0.50 | 3D構造情報を使わない |
| AlphaMissense | AlphaFold構造 + 配列進化 | ClinVar AUC-ROC ≈ 0.89、4.5億変異を公開 | DMS実験データを統合しない |
| CADD v1.7 | 63アノテーション特徴量 | ゲノムワイドな優先順位付け | 深層学習の表現力に劣る |
| REVEL | 13 VEPツールのメタスコア | AUC-ROC ≈ 0.90 | 構造情報の活用が不十分 |
| PIRATE | 配列 + 変異 + 3D構造 | マルチモーダル、表現型特異的 | 計算コスト大、公開されていない |
核心的課題: 既存手法はいずれも 単一モダリティ または 限定的な統合 にとどまっている。配列(1次元)・構造(3次元グラフ)・機能(実験スカラー)という異なる表現空間を統合し、さらに Active Learning で wet-lab 実験を効率化 するシステムは存在しない。
3. 提案手法 — マルチモーダル深層学習アーキテクチャ「ProtMutAI」
3モダリティ統合アーキテクチャ
配列モダリティ 構造モダリティ 機能モダリティ
┌─────────────────┐ ┌───────────────────┐ ┌─────────────────┐
│ ESM-2 (650M) │ │ AlphaFold構造 │ │ DMS実験データ │
│ 配列埋め込み │ │ 残基グラフ構築 │ │ fitness正規化 │
│ Fine-tuning(6層)│ │ GAT 3層 │ │ 1D-CNN + Attn │
│ │ │ (8-head attention)│ │ │
│ → 1280次元 │ │ → 512次元 │ │ → 256次元 │
└────────┬────────┘ └────────┬──────────┘ └────────┬────────┘
│ │ │
└──────────────────────┼────────────────────────┘
│
┌───────────▼───────────┐
│ Cross-Attention │
│ 融合層 │
│ → 2048次元 → 512次元 │
└───────────┬───────────┘
│
┌─────────────────┼─────────────────┐
│ │ │
┌─────────▼────┐ ┌────────▼─────┐ ┌───────▼──────┐
│ DMS回帰 │ │ 病原性分類 │ │ 安定性予測 │
│ Spearman ρ │ │ AUC-ROC │ │ ΔΔG回帰 │
└──────────────┘ └──────────────┘ └──────────────┘
各モダリティの詳細
配列モダリティ — ESM-2 タンパク質言語モデル
- 入力: 野生型アミノ酸配列 + 変異位置・変異残基
- 処理: ESM-2 (650M パラメータ) → 野生型・変異型の両方を埋め込み → 差分ベクトル算出
- Fine-tuning: 最終 6 層のみ(GPU 約 40 時間)
-
Co-Scientist スキル:
co-scientist-transfer-learning,co-scientist-sequence-analysis - ToolUniverse: UniProt API(配列取得)、Ensembl API(変異マッピング)
構造モダリティ — Graph Neural Network
- 入力: AlphaFold 予測構造 + pLDDT スコア
- 処理: 残基グラフ構築(ノード: Cα座標 + 側鎖特徴、エッジ: 残基間距離 < 10Å)→ GAT 3層
- 特徴: 変異位置の 2-hop 局所サブグラフに注目
-
Co-Scientist スキル:
co-scientist-graph-neural-networks,co-scientist-alphafold-structures - ToolUniverse: AlphaFold DB API, RCSB PDB API
- AI Foundry: RosettaFold3(未登録タンパク質)、BioEmu-1(変異前後の動態シミュレーション)
機能モダリティ — DMS 実験データ
- 入力: Deep Mutational Scanning fitness スコア
- 処理: Z-score 正規化 → 1D-CNN(カーネル 3,5,7)+ Self-Attention
-
Co-Scientist スキル:
co-scientist-deep-learning,co-scientist-data-analysis
革新点: Active Learning ループ
モデル予測 → 不確実性の高い変異を抽出 → wet-lab実験を優先順位付け
↑ ↓
└───── 実験結果をモデルに再学習 ←───────────┘
co-scientist-active-learning スキルが、モデルの不確実性推定(MC Dropout / Deep Ensemble)に基づき、次に実施すべき実験候補を自動提案する。
4. データセット設計 — Co-Scientist が自動構築する統合データ
データソースと件数
| データソース | 件数(目標) | サイズ | 取得に使う Co-Scientist スキル | ToolUniverse API |
|---|---|---|---|---|
| UniProt 配列 | ~20,000タンパク質 | ~2GB | uniprot-proteome |
UniProt API |
| AlphaFold 構造 | ~20,000構造 | ~200GB | alphafold-structures |
AlphaFold DB API |
| DMS 実験データ | ~200アッセイ、~2M変異 | ~5GB | data-analysis |
MaveDB |
| gnomAD 変異頻度 | ~10M変異 | ~50GB | gnomad-variants |
gnomAD API |
| ClinVar 臨床分類 | ~500K変異 | ~1GB | variant-interpretation |
ClinVar |
| InterPro ドメイン | ~20,000タンパク質 | ~500MB | protein-domain-family |
InterPro/Pfam |
| STRING PPI | ~20,000タンパク質 | ~2GB | protein-interaction-network |
STRING API |
| Ensembl VEP スコア | ~10M変異 | ~10GB | variant-effect-prediction |
Ensembl VEP API |
合計ストレージ: ~270GB → Azure Blob Storage(Hot tier)
データ統合パイプライン
[Co-Scientist 自動パイプライン]
co-scientist-uniprot-proteome ──→ 配列 ──→ ESM-2埋め込み ──→ ┐
│
co-scientist-alphafold-structures ──→ 構造 ──→ GNN特徴量 ──→ ├──→ 統合データセット
│ (Azure Cosmos DB)
co-scientist-data-analysis ──→ DMS ──→ 正規化 ────────────→ ┤
│
co-scientist-gnomad-variants ──→ 頻度 ──→ ラベル付与 ──────→ ┘
co-scientist-variant-interpretation ↗
ポイント: 従来は研究者が各データベースの API ドキュメントを読み、個別にスクリプトを書いてデータを取得していた。筆者開発の Co-Scientist(科学研究のドメイン知識を持つ AI エージェント)と ハーバード大学医学部開発の ToolUniverse(1,000+ の科学ツール API を MCP プロトコルで統合した基盤)を掛け合わせることで、自然言語で「UniProt から BRCA1 の配列を取得して」と指示するだけ で、API 呼び出し → パース → 保存が自動実行される。Co-Scientist が「何をすべきか」を判断し、ToolUniverse が「どう実行するか」を提供する — この役割分担が高度な研究自動化を実現する。
5. Azure システム構成 — GPU コストはたった ¥5.5万
アーキテクチャ概要
┌────────────────────────────────────────────────────────────────┐
│ Azure Subscription │
│ Resource Group: rg-protmutai │
│ │
│ ┌────────────────┐ ┌────────────────┐ ┌────────────────┐ │
│ │ Azure Machine │ │ Azure Container│ │ Azure AI │ │
│ │ Learning │ │ Apps │ │ Foundry │ │
│ │ │ │ │ │ │ │
│ │ NC A100 v4 │ │ CoreClaw │ │ RosettaFold3 │ │
│ │ (1 GPU Spot) │ │ Co-Scientist │ │ BioEmu-1 │ │
│ │ 250 hr 訓練 │ │ ToolUniverse │ │ │ │
│ │ MLflow追跡 │ │ MCP Server │ │ │ │
│ └───────┬────────┘ └───────┬────────┘ └───────┬────────┘ │
│ │ │ │ │
│ └───────────────────┼───────────────────┘ │
│ │ │
│ ┌────────────────┐ ┌──────┴─────────┐ ┌────────────────┐ │
│ │ Azure Blob │ │ Azure OpenAI │ │ Azure Cosmos │ │
│ │ Storage │ │ Service │ │ DB (Serverless)│ │
│ │ │ │ │ │ │ │
│ │ ~270GB │ │ GPT-4o │ │ 変異-タンパク質 │ │
│ │ データセット │ │ アノテーション │ │ 知識グラフ │ │
│ └────────────────┘ └────────────────┘ └────────────────┘ │
└────────────────────────────────────────────────────────────────┘
コンポーネント詳細
| コンポーネント | SKU | 用途 | 月額概算 |
|---|---|---|---|
| Azure ML GPU | NC24ads_A100_v4 (Spot) | モデル訓練 250hr | ¥55,000 / 6ヶ月 |
| Azure ML CPU | DS3_v2 | データ前処理、推論 | ¥4,050 / 月 |
| Azure ML Workspace | Basic | 実験追跡、MLflow | 無料 |
| Blob Storage | Standard_LRS 530GB | データセット保存 | ¥1,664 / 月 |
| Container Apps | Consumption | CoreClaw + ToolUniverse | ¥3,000 / 月 |
| Azure OpenAI | GPT-4o | アノテーション・レポート | ¥7,500 / 月 |
| Cosmos DB | Serverless | 知識グラフ | ¥3,000 / 月 |
| AI Foundry | RosettaFold3, BioEmu-1 | 構造予測、動態シミュレーション | ¥5,000 / 月 |
GPU コスト詳細 — Spot Instance で 60% 削減
| タスク | GPU時間 | 備考 |
|---|---|---|
| ESM-2 fine-tuning | 40 hr | 最終6層のみ |
| GNN 訓練(GAT) | 30 hr | PyTorch Geometric、5-fold CV |
| マルチモーダル融合訓練 | 50 hr | Cross-Attention、マルチタスク |
| ハイパーパラメータ探索 | 50 hr | Optuna 50トライアル |
| BioEmu-1 特徴抽出 | 15 hr | 構造アンサンブル |
| 評価・Ablation | 30 hr | ベンチマーク + 6パターン |
| 予備(再実験) | 35 hr | |
| 合計 | 250 hr |
| 計算方法 | 単価 | 250 hr |
|---|---|---|
| 通常料金 | ¥550.5/hr | ¥137,625 |
| Spot料金(60%割引) | ¥220/hr | ¥55,000 |
| Spot料金(70%割引) | ¥165/hr | ¥41,250 |
採用見積: ¥55,000(保守的に 60% 割引で計算)
💡 Spot Instance のリスク管理: プリエンプト(中断)される可能性があるため、10 エポックごとのチェックポイント保存を設定。Azure ML のジョブ自動再開機能と組み合わせることで、Spot Instance でも安定した訓練が可能。
6. コスト全体像 — SPReAD1000 の予算を最大限活用するために
⚠️ 重要: SPReAD1000 の予算は直接経費(クラウドインフラ等)に充当されます。 以下のコスト表は「このプロジェクトを実施するために実際に必要な費用」の全体像を示しています。人件費については、所属機関の運営費交付金や他の外部資金との組み合わせで確保する設計です。
プロジェクト全体で必要な費用(参考)
| カテゴリ | 6ヶ月合計(¥) | SPReAD1000 で支出可能か |
|---|---|---|
| Azure クラウドインフラ | ¥402,000 | ✅ 可能 |
| ソフトウェア・ライセンス | ¥60,000 | ✅ 可能 |
| 旅費・学会参加費 | ¥150,000 | ✅ 可能 |
| 消耗品・その他 | ¥50,000 | ✅ 可能 |
| 予備費 | ¥138,000 | ✅ 可能 |
| SPReAD1000 対象経費 合計 | ¥800,000 | |
| 人件費(PI 20% + ポスドク 100% + RA 50%) | ¥3,600,000 | ❌ 別途確保が必要 |
| プロジェクト全体 | ¥4,400,000 |
💡 Azure コストはわずか ¥40万。SPReAD1000 の ¥500万予算に対して十分な余裕があり、残りの予算を旅費・消耗品・その他の研究活動に充てることができます。なお、人件費の ¥360万 については、所属機関の運営費交付金、科研費、その他の外部資金と組み合わせて確保する想定です。
多様なスキルセットが求められる — AI エージェントの出番
このプロジェクトを実現するには、研究テーマのドメイン知識だけでなく、クラウドインフラの設計・構築、深層学習モデルの実装、アプリケーション開発 を一体的に遂行する必要がある。ここで AI エージェントが大きな力を発揮する。
| 必要なスキル | 具体的な作業 | 一般的な研究者が持っているか |
|---|---|---|
| バイオインフォマティクス | VEP手法の選定、DMS/gnomAD データの解釈 | ✅ 専門分野 |
| 深層学習(PyTorch) | ESM-2 fine-tuning、GNN実装、Cross-Attention | △ 一部の計算生物学者 |
| Azure クラウド設計 | ML Workspace, Spot GPU, Container Apps, AI Foundry 構成 | ❌ ほぼいない |
| アプリケーション開発 | 推論API、ダッシュボード、データパイプライン | ❌ ほぼいない |
| IaC / DevOps | Bicep/Terraform、CI/CD、コンテナ化 | ❌ ほぼいない |
| コスト最適化 | Spot Instance 戦略、Serverless 設計、SKU選定 | ❌ ほぼいない |
現実: ドメイン知識を持ち、かつ AI・IT インフラに精通した人材は多くないのが実情である。多くの研究室では、クラウド構築やアプリケーション開発のために外部のエンジニアやベンダーとの連携が必要になる。SPReAD1000 の 180 日という期間を最大限に活かすには、こうしたスキルギャップを埋める手段が鍵となる。
だからこそ、AI エージェントが必要。本記事で示したように、SPReAD1000-Builder が Azure の最適構成を自動設計し、MUSUBIX2 がアプリケーションを仕様駆動で開発し、Co-Scientist × ToolUniverse がデータ収集からモデル構築まで自動化する。ドメイン知識を持つ研究者 × 専用 AI エージェント の組み合わせにより、従来は 3-5 名のチームが必要だった作業を、1人の研究者 + AI で遂行できる可能性がある。
もし Co-Scientist がいなかったら
Co-Scientist なしで同じプロジェクトを実施する場合、何が起きるかを具体的に示す。
データ収集フェーズ(Phase A)の比較
| 作業 | Co-Scientist あり | Co-Scientist なし |
|---|---|---|
| UniProt から 20,000 配列取得 |
uniprot-proteome スキル → 自然言語で指示 → 自動取得・パース・保存(数分) |
UniProt REST API のドキュメントを読む → Python スクリプトを書く → エラーハンドリング → ページネーション対応(2-3日) |
| AlphaFold 20,000 構造取得 |
alphafold-structures → バッチダウンロード + pLDDT自動抽出(数分) |
AlphaFold DB API を調査 → ダウンロードスクリプト → 200GB のストレージ管理 → PDB パーサー実装(3-5日) |
| gnomAD 10M 変異頻度 |
gnomad-variants → 遺伝子リストから一括取得(数十分) |
gnomAD GraphQL API を学習 → クエリ設計 → レート制限対応 → データ正規化(3-5日) |
| CADD/REVEL/AlphaMissense スコア |
variant-effect-prediction → Ensembl VEP 経由で一括取得(数十分) |
VEP REST API の仕様を理解 → バッチ処理スクリプト → 結果マージ(2-3日) |
| ドメイン分類 + PPI |
protein-domain-family + protein-interaction-network → 自動(数分) |
InterPro API + STRING API を個別に学習・実装(2-3日) |
| Phase A 合計 | 1-2日(ToolUniverse API が実行) | 2-3週間(全て手作業でスクリプト開発) |
モデル開発フェーズ(Phase B)の比較
| 作業 | Co-Scientist あり | Co-Scientist なし |
|---|---|---|
| ESM-2 fine-tuning 設計 |
transfer-learning スキルが最適な凍結戦略・学習率を提案 → 即座に実装コード生成 |
論文を複数読み → 試行錯誤で戦略決定 → 自分でコード記述(+1-2週間) |
| GNN アーキテクチャ |
graph-neural-networks が GAT vs GCN vs GraphSAGE を比較提案 → PyTorch Geometric コード生成 |
PyG のドキュメント → チュートリアル → 自分で実装・デバッグ(+1-2週間) |
| ハイパラ最適化 |
bayesian-statistics が Optuna の探索空間を自動設計 |
Optuna のドキュメントを読む → 探索空間を手動設計(+数日) |
| 結果の解釈 |
explainable-ai が SHAP/Attention 可視化を自動実行 |
SHAP ライブラリの使い方 → 可視化コード(+数日) |
プロジェクト全体の所要期間
| Co-Scientist あり | Co-Scientist なし | |
|---|---|---|
| Phase A(データ収集) | 2ヶ月(Month 1-2) | 3-4ヶ月 |
| Phase B(モデル開発) | 2ヶ月(Month 2-4) | 4-6ヶ月 |
| Phase C(評価・検証) | 2ヶ月(Month 4-6) | 2-3ヶ月 |
| 合計 | 6ヶ月(SPReAD期間内に完了) | 9-13ヶ月(期間内完了が難しい) |
⚠️ Co-Scientist を活用することで、SPReAD1000 の 180 日間で評価・検証(Phase C)まで到達できる可能性が大きく高まります。 従来の手作業中心のアプローチでは Phase B(モデル開発)までに時間を要しがちですが、AI エージェントによる自動化がこのボトルネックを解消します。
さらに見落とされがちな点として、Co-Scientist の 5 エージェント(Research Lead / Methods Auditor / Statistician / Data Steward / Writing Coach) は、1人の研究者が陥りがちな「手法の偏り」「統計的な誤り」「データ品質の見落とし」を自動的にチェックする。これは従来、共同研究者やラボミーティングでのピアレビューが担っていた役割であり、1人で研究する場合に特に価値が高い。
前回記事(人文社会科学)との比較
| 項目 | 第1弾:少子化×GraphRAG | 第2弾:タンパク質変異AI(本記事) |
|---|---|---|
| 分野 | 人文社会科学 | バイオインフォマティクス |
| 主要技術 | GraphRAG + Leiden法 | ESM-2 + GNN + Cross-Attention |
| Azure コスト / 6ヶ月 | ¥1,130,000(22.6%) | ¥402,000(8.0%) |
| 主要リソース | Azure AI Search S1 + GPT-4o | A100 Spot 250hr + AI Foundry |
| 人件費比率 | 84.6% | 72.0% |
| 予算内実現 | △(縮小版 ¥420万で可能) | ✅(¥440万で余裕あり) |
| 研究自動化 | SHIKIGAMI のみ | Co-Scientist(筆者開発)× ToolUniverse(ハーバード医学部) |
注目ポイント: バイオ系のほうが Azure コストが低い。GPU 訓練は Spot Instance で大幅に削減でき、データ取得は ToolUniverse 経由の公開 API で無料。一方、人文系は GraphRAG のインデックス構築に大量の LLM トークンが必要で、Azure AI Search の常時稼働コストもかかる。
7. 研究計画 — 12ヶ月ロードマップ
SPReAD1000 対象期間(Month 1-6)
Month 1-2: Phase A [データ収集・統合]
━━━━━━━━━━━━━━━━━━━━━
co-scientist-uniprot-proteome → 20,000 タンパク質配列
co-scientist-alphafold-structures → 20,000 構造
co-scientist-gnomad-variants → 10M 変異頻度
co-scientist-variant-effect-prediction → CADD/REVEL/AlphaMissense
co-scientist-protein-domain-family → ドメイン分類
co-scientist-protein-interaction-network → PPI グラフ
Month 2-4: Phase B [モデル開発]
━━━━━━━━━━━━━━━━━━━━━
co-scientist-transfer-learning → ESM-2 fine-tuning
co-scientist-graph-neural-networks → GAT アーキテクチャ
co-scientist-deep-learning → 1D-CNN + Cross-Attention
co-scientist-multi-task-learning → マルチタスクヘッド
co-scientist-bayesian-statistics → Optuna ハイパラ最適化
Azure AI Foundry → RosettaFold3 / BioEmu-1
Month 4-6: Phase C [評価・検証]
━━━━━━━━━━━━━━━━━━━━━
co-scientist-experimental-design → 評価実験計画
co-scientist-explainable-ai → SHAP, Attention 可視化
co-scientist-active-learning → 実験候補優先順位付け
co-scientist-academic-writing → 論文執筆支援
co-scientist-reproducibility → 再現性チェック
拡張研究(Month 7-12)
| フェーズ | 内容 | 目標 |
|---|---|---|
| Phase D-1 | ゲノムワイド展開 | ClinVar VUS 10万件の再分類 |
| Phase D-2 | 創薬応用 | 創薬標的タンパク質への特化 |
| Phase D-3 | 臨床実装 | 臨床遺伝学ワークフロー統合 |
8. ChatGPT / Claude との壁打ちでは、こうはならない
ここまでの設計書一式を見て、「ChatGPT に頼めば同じものが出るのでは」と思うかもしれません。実際に試してみるとわかりますが、汎用 AI チャットで得られるのは 「それらしい雰囲気の回答」 であり、設計判断に使える精度の情報 ではありません。
| 汎用AIチャットに聞いた場合 | 本記事の設計書 |
|---|---|
| 「深層学習を使いましょう」(アーキテクチャ不明) | ESM-2 1280次元 + GAT 512次元 + 1D-CNN 256次元の Cross-Attention 融合 を具体設計 |
| 「GPU を使います」(SKU不明) | NC24ads_A100_v4 Spot ¥220/hr × 250hr = ¥55,000 と実価格ベースで算出 |
| 「UniProt からデータを取得します」(方法不明) |
Co-Scientist uniprot-proteome → ToolUniverse UniProt API で自動取得パイプライン構築 |
| 「AlphaFold の構造を使います」(統合方法不明) | GAT 3層(8-head attention)で残基グラフ化、変異位置の 2-hop サブグラフに注目 と実装レベルで設計 |
| 「500万円で可能です」(根拠なし) | ¥440万(Azure 8% + 人件費 72%) と費目別に積算 |
| 「Active Learning で効率化」(仕組み不明) | MC Dropout + Deep Ensemble → 不確実性推定 → 実験候補自動提案 の具体フロー |
この差が生まれる理由は明確です:
- モデルアーキテクチャ設計は人間の知見 — 「ESM-2 埋め込み + AlphaFold 構造 GNN + DMS データを Cross-Attention で融合する」という設計判断は、最新の VEP 研究動向を追い続けている実務者だからこそ下せる
- 汎用AIは最新GPU料金を知らない — A100 Spot の割引率やリージョン別の在庫状況は学習データに含まれない
- 汎用AIに筆者開発の Co-Scientist 202スキルのカタログがない — どのスキルがどの研究フェーズに対応するかを知らない
- 汎用AIにハーバード医学部開発の ToolUniverse の API 仕様がない — UniProt API / gnomAD API / AlphaFold DB API の 1,000+ ツールの具体的なエンドポイントとレスポンス形式を知らない
- 汎用AIに設計プロセスがない — 「データ設計 → モデル設計 → GPU見積もり → コスト積算 → 研究計画」を一貫したワークフローで実行できない
つまり、「何を作るべきか」を決めるのは筆者の知見、「それをどう設計書に落とし込むか」を高速化するのが専用エージェント — この両輪があるから約40分で設計書一式が完成します。
9. 約40分で設計書一式を生成できた仕組み
知見 × エージェント = 両輪
研究者の一言
「タンパク質変異の影響予測をマルチモーダル深層学習で」
│
▼
┌─────────────────────────────────────────────────────┐
│ SPReAD1000-Builder(応募支援 Agent Skills) │
│ 「SPReAD公募の文脈で何が必要か」を知っている │
│ Azure最適構成設計 / 最新価格表参照の費用概算 │
│ 12スキル: コンテキスト収集 → 研究計画 → Azure設計 │
│ → コスト算出 → 申請書作成 → 最終レビュー │
├─────────────────────────────────────────────────────┤
│ SHIKIGAMI(Deep Research Agent + MCP Server) │
│ 「調べもの → 構造化 → レポート」の品質を保証する │
│ 6フェーズ: 目的探索 → 調査 → 分析 → レポート生成 │
│ 53フレームワーク / 33テンプレート / 11 MCPツール │
├─────────────────────────────────────────────────────┤
│ Co-Scientist(筆者開発 科学技術者AI Agent) │
│ 202スキル / 5エージェント │
│ × ToolUniverse(ハーバード医学部開発 MCP 1000+) │
│ 「知識を持つAI × 世界最高峰の科学ツール」で研究自動化 │
├─────────────────────────────────────────────────────┤
│ MUSUBIX2(SDD開発基盤 + MCP Server) │
│ 「アプリケーションを仕様駆動で開発する」基盤 │
│ 26パッケージ / 61 MCPツール / EARS形式の要件管理 │
└─────────────────────────────────────────────────────┘
│
▼
設計書一式(研究計画 / Azure構成 / コスト見積 / 統合提案書)
所要時間の内訳
| 工程 | 所要時間 | 担当 |
|---|---|---|
| テーマ提示 + 技術選定の指示 | 5 分 | 筆者 |
| Web 調査(ESM, AlphaMissense, PIRATE, GPU料金) | 10 分 | SHIKIGAMI |
| Co-Scientist スキルカタログ調査 | 5 分 | SHIKIGAMI |
| 設計書 4 本生成(研究計画/Azure構成/コスト/提案書) | 30 分 | SPReAD1000-Builder |
| Qiita 記事執筆 | 10 分 | SHIKIGAMI |
| 合計 | 約60分 |
10. ツール詳細 — 4層のAIエージェント連携
SPReAD1000-Builder
GitHub: nahisaho/spread1000-builder
SPReAD1000 公募に特化した Agent Skills。Azure のベストな構成を設計し、最新の価格表を参照しながら費用概算を自動算出する。
| 機能 | 説明 |
|---|---|
| コンテキスト収集 | SPReAD1000 の公募要領・審査基準を理解 |
| Azure 最適構成 | ユースケースに応じた SKU 選定(GPU, Storage, AI Foundry) |
| 最新価格表参照 | Azure Pricing Calculator の実データを取得して積算 |
| 研究計画生成 | 12ヶ月ロードマップ + フェーズ別マイルストーン |
| 申請書作成 | SPReAD1000 フォーマットに準拠した申請書テンプレート |
SHIKIGAMI
Deep Research Agent + MCP Server。6フェーズのワークフローで調査品質を担保する。
| 仕様 | 値 |
|---|---|
| フレームワーク | 53 種類(SWOT, 3C, PEST, 5Forces 他) |
| レポートテンプレート | 33 種類 |
| MCP ツール | 11 種類 |
| ワークフロー | 目的探索 → 調査 → 分析 → レポート生成 |
CoreClaw + Co-Scientist(筆者開発)
GitHub: nahisaho/coreclaw / GitHub: nahisaho/coreclaw-marketplace
CoreClaw は Chat フロントエンド + Agent Skills の実行基盤。Docker 隔離環境で安全に実行。Co-Scientist は筆者が開発した科学技術者 AI エージェント で、202 スキル / 5 エージェントを備え、研究ライフサイクル全体(文献調査 → データ収集 → 分析 → モデル構築 → 論文執筆)を自動化する。
ToolUniverse との掛け合わせ
Co-Scientist 単体でも研究の方向性提案や分析設計は可能だが、ハーバード大学医学部が開発した ToolUniverse(1,000+ の科学ツール API) と MCP プロトコルで接続することで、提案 → 実行 が一気通貫で行える。
Co-Scientist(筆者開発) ToolUniverse(ハーバード医学部開発)
┌────────────────────┐ ┌─────────────────────┐
│ 「何をすべきか」 │ MCP │ 「どう実行するか 」 │
│ ドメイン知識 │◄────────► │ 1,000+ 科学ツールAPI │
│ 研究戦略設計 │ Protocol │ UniProt / AlphaFold │
│ 結果解釈・次の一手 │ │ gnomAD / PDB / ... │
└────────────────────┘ └─────────────────────┘
この掛け合わせにより、従来は数週間かかったデータ収集・前処理・ベースライン比較が 数十分で完了 する。
| Co-Scientist エージェント | 役割 |
|---|---|
| Research Lead | 研究全体の方向性管理 |
| Methods Auditor | 手法の妥当性検証 |
| Statistician | 統計解析設計 |
| Data Steward | データ品質管理 |
| Writing Coach | 論文執筆支援 |
本プロジェクトで使用する主な Co-Scientist スキル
| フェーズ | スキル名 | 用途 | ToolUniverse API |
|---|---|---|---|
| データ収集 | uniprot-proteome |
配列・アノテーション取得 | UniProt API |
| データ収集 | alphafold-structures |
構造・pLDDT取得 | AlphaFold DB API |
| データ収集 | gnomad-variants |
変異頻度・LoF制約 | gnomAD API |
| データ収集 | variant-effect-prediction |
CADD/REVEL/AlphaMissense | Ensembl VEP API |
| データ収集 | protein-domain-family |
ドメイン分類 | InterPro/Pfam |
| データ収集 | protein-interaction-network |
PPI ネットワーク | STRING API |
| モデル構築 | deep-learning |
PyTorch モデル実装 | — |
| モデル構築 | graph-neural-networks |
GAT/GCN 設計 | — |
| モデル構築 | multi-task-learning |
マルチタスクヘッド | — |
| モデル構築 | transfer-learning |
ESM-2 fine-tuning | — |
| 実験設計 | experimental-design |
評価実験計画 | — |
| 実験設計 | active-learning |
実験候補優先順位付け | — |
| 実験設計 | bayesian-statistics |
ハイパラ最適化 | — |
| 評価 | explainable-ai |
SHAP, Attention 可視化 | — |
| 論文 | academic-writing |
論文執筆支援 | — |
| 品質 | reproducibility |
再現性チェック | — |
MUSUBIX2
仕様駆動開発(SDD)基盤 + MCP Server。ProtMutAI の推論 API やダッシュボードの開発に使用。
| 仕様 | 値 |
|---|---|
| パッケージ | 26 種類 |
| MCP ツール | 61 種類 |
| 要件管理 | EARS 形式 |
| 開発手法 | 仕様駆動開発(9条の憲法) |
11. まとめ — 知見とエージェントの両輪
本記事で示したこと
- SPReAD1000 の予算で Azure コストは ¥40万(8%)に収まる — ただし人件費は別途確保が必要
- マルチモーダル深層学習(ESM + GNN + DMS → Cross-Attention) の具体的なアーキテクチャ設計
- Co-Scientist 202 スキル × ToolUniverse 1,000+ ツール による研究パイプラインの自動化
- Active Learning ループ で wet-lab 実験の効率を最大化
- 1人の研究者では実現困難 — クラウド設計・アプリ開発・AI実装を兼ね備えた人材が必要
- AI エージェントがそのギャップを埋める — 約40分で設計書一式が完成
研究者に必要なのは「テーマと技術選定」— ただしそれだけでは足りない
繰り返しになりますが、AI エージェントだけでは設計書は作れません。「このユースケースには ESM-2 の配列埋め込みと AlphaFold 構造の GNN を Cross-Attention で融合するマルチモーダルアプローチが有効だ」 という判断は、バイオインフォマティクスと AI の両方に精通した実務者の知見です。
そして、「Co-Scientist の variant-effect-prediction スキルで gnomAD から既存スコアを取得し、graph-neural-networks スキルで構造グラフを構築し、active-learning スキルで実験候補を優先順位付けする」 という研究パイプラインの設計も、ツールの機能を理解した上での判断です。
しかし現実には、この「知見」を持つ人材は極めて少ない。ドメイン知識(バイオインフォマティクス)× AI/ML 実装力 × クラウドインフラ設計 × アプリケーション開発 — これらすべてを1人で持つ研究者はほぼ存在しない。従来であれば 3-5 名の異分野チームが必要だった。
知見 × エージェント = 両輪。AI エージェントが「クラウド設計」「アプリ開発」「データパイプライン構築」を代替することで、ドメイン知識を持つ研究者 1人 でもプロジェクトを立ち上げられる — それが本記事で示したかったことです。
本記事の設計書一式
本記事の元になった詳細設計書をリポジトリで公開しています:
| ファイル | 内容 |
|---|---|
phase0-research-plan.md |
12ヶ月研究プラン(Co-Scientist スキルマッピング付き) |
phase1-azure-architecture.md |
Azure構成設計書(全コンポーネント詳細) |
phase2-cost-estimate.md |
詳細コスト見積もり(Azure Spot 料金ソース付き) |
phase3-proposal.md |
統合プロジェクト提案書(マルチモーダルアーキテクチャ詳細) |
⚠️ これらは AI が生成した叩き台 です。実際の応募書類にそのまま使うのではなく、ご自身の研究テーマ・専門知識・所属機関の状況に合わせてカスタマイズしてください。特にコスト試算は、Azure Pricing Calculator で最新価格を確認してください。
シリーズ記事
| # | 分野 | ユースケース | 記事 |
|---|---|---|---|
| 1 | 人文社会科学 | 少子化×AI横断分析(GraphRAG) | 【SPReAD1000】文科省ユースケース「少子化×AI横断分析」を本気で設計したら、500万円では足りなかった話 |
| 2 | バイオインフォマティクス | タンパク質変異予測AI(本記事) | 本記事 |
分野が変わっても、エージェントは同じ。約40分で設計書一式。