この記事自体が「AI for Science」の実験です
本記事は、人間が書いたものではありません。
筆者が開発した AI エージェント群(SHIKIGAMI / SPReAD1000-Builder / MUSUBIX2)が、実際に Web 上の Azure 料金ページにアクセスし、GraphRAG の GitHub リポジトリを調査し、Microsoft Research の論文を精読し、その結果を構造化して設計書を生成し、この記事を執筆しました。 筆者が行ったのは、「少子化の各国文献をAIで横断分析したい」というテーマの提示と、GraphRAG という技術選定、そしてエージェントとの対話による方向修正です。
つまり、この記事の作成プロセス自体が「AI for Science」の実験 です。
- AI エージェントが最新の Azure 料金を取得して費用概算を算出する → 実験
- AI エージェントが GraphRAG と通常 RAG のコスト差を検証する → 検証
- AI エージェントが SPReAD1000 の予算制約内で実現可能なスコープを導出する → 分析
- その一連のプロセスを記事として出力する → 文書化
「AI に研究計画を作らせたらどこまでできるのか」 — その答えが、以下に続く設計書一式です。
この記事は誰のためのものか
SPReAD1000 への応募を検討している研究者 の方へ。
文部科学省の応募者説明会で提示されたユースケースイメージを見て、「面白そうだけど、実際どうやってシステムを組むの?」「500万円 / 180日で具体的に何ができるの?」と思った方は多いのではないでしょうか。
本記事では、提示されたユースケースの一つ 「少子化に関する各国文献のAI横断分析」 を題材に、実際に必要な技術構成・コスト・期間・体制を具体的に試算しました。結論から言うと、スコープを適切に設計すれば SPReAD1000 の枠内で十分に意味のある成果を出せます。本格的な拡張は SPReAD1000 を足がかりに次のフェーズで展開する設計です。
その見通しを、Azure の具体的なサービス名と料金まで落とし込んでお見せします。
💬 「ChatGPT や Claude に聞けば同じようなものが出てくるのでは?」と思った方へ。
試してみてください。「SPReAD1000 で少子化の横断分析をしたい。Azure の構成と料金を教えて」と聞けば、それらしい回答は返ってきます。しかし、そもそも 「このユースケースには GraphRAG が必要だ」という技術選定の判断 を、汎用AIは下せません。ChatGPT に聞けば「RAG を使いましょう」と返ってくるでしょう。しかし通常の RAG では「38カ国に共通する未知の論点」は発見できません。GraphRAG の Global Search と Leiden 法によるコミュニティ検出がこのユースケースに不可欠だ と判断できるのは、AI for Science の技術動向を追い続けている実務者の知見です。
さらに、GPT-4o の入力トークン単価が $5/1M であること、Azure AI Search S1 が月額 $245.28 であること、GraphRAG のインデックスコストが通常 RAG の 100〜1,000倍であること — こうした 設計判断を左右する具体的な数値 は、汎用 AI チャットでは正確に出てきません。本記事では、SPReAD1000-Builder が Azure の最新価格表を実際に参照しながら、SKU 別の比較と費用概算を自動算出しています。
本記事の設計書は、筆者の AI for Science に関する知見(GraphRAG という技術選定)と、専用 AI エージェント群(最新価格を参照した Azure 構成設計・費用概算・設計書生成)の掛け合わせで生まれたものです。どちらか一方では成立しません(詳しくは 第9節)。
1. ユースケースの全体像 — そもそも何をやるのか
文科省が提示したユースケースイメージ
世界各国の白書・論文・調査報告書等をAIで横断検索・比較し、少子化に関する未検証論点や、日本の分析で見落とされている論点を抽出。
もう少し噛み砕くと、こういうことです。
- OECD加盟38カ国の少子化関連文献(白書・論文・報告書)を 大量に集めて
- AIで中身を読み解き、各国の論点を 構造的に整理して
- 「日本ではまだ検証されていない切り口」を 機械的に発見する
なぜ人手では限界があるのか
| 壁 | 具体例 |
|---|---|
| 量の壁 | 38カ国 × 過去10年 × 白書+論文 ≈ 4,000〜9,000件。1人で通読するなら数年かかる |
| 言語の壁 | 英語・仏語・独語・各国語が混在。検索キーワードすら網羅が難しい |
| 比較の壁 | 「フランスの育児休業制度」と「韓国の保育費補助」を同じ軸で並べる作業は認知負荷が高すぎる |
| 発見の壁 | そもそも「日本で議論されていないこと」は、日本語の文脈だけでは気づけない |
この最後の 「知らないことを知らない」問題 が核心です。通常のキーワード検索では、知っていることしか検索できません。ここにAI、特に GraphRAG を使う理由があります。
2. なぜ「普通のAI検索」ではダメなのか — GraphRAG という選択
📌 著者の知見: このユースケースに対して GraphRAG を選択したのは、汎用AIに聞いて出てきた答えではありません。Microsoft Research の GraphRAG 論文、LazyGraphRAG のベンチマーク結果、そして複数の RAG 手法の比較検証を通じて、「未知の論点を発見する」というこのユースケースの本質的要件には、通常の Vector RAG では不十分であり、GraphRAG の Global Search が不可欠だと判断したものです。技術選定こそが、AI for Science プロジェクトの成否を分ける最大のポイントです。
一般的な RAG の限界
最近よく聞く RAG(Retrieval-Augmented Generation)は、文献をチャンク(断片)に分割し、質問に似た断片を探してLLMに渡す方式です。「この文献の中に○○について書いてある箇所はどこ?」という質問には強いのですが——
このユースケースの中核的な問い には答えられません。
- 「38カ国の少子化対策に共通する論点は何か?」 → 全体俯瞰ができない
- 「日本で見落とされている論点は何か?」 → 知らないことは検索できない
- 「フランスとドイツと韓国の施策はどう関連しているか?」 → 文献間の関係が見えない
GraphRAG が可能にすること
Microsoft GraphRAG は、文献から エンティティ(概念・制度・人名・組織) と 関係 を抽出し、知識グラフを自動構築します。さらに Leiden法 というコミュニティ検出アルゴリズムで、トピックの自然なクラスタを発見します。
普通のRAG:
文献 → 断片化 → "似た断片を探す" → 回答
→ 「知っていること」しか見つからない
GraphRAG:
文献 → エンティティ・関係を抽出 → 知識グラフ構築
→ コミュニティ(トピック群)を自動検出
→ 「各コミュニティの要約」から全体俯瞰
→ 「知らなかったこと」が浮かび上がる
研究者にとって最も価値があるのは、この 2つの検索モード です:
| モード | 問いの例 | 仕組み |
|---|---|---|
| Global Search | 「各国の少子化対策で共通する論点トップ10は?」 | 全コミュニティのサマリを横断して回答 |
| Local Search | 「フランスの父親育休制度の詳細は?」 | 特定エンティティ周辺のグラフを深掘り |
💡 研究者向けのポイント: GraphRAG の Global Search は、いわば「4,000件の文献を全部読んだ上での俯瞰レビュー」を機械的に行うものです。未知のトピッククラスタが自動で見つかるため、システマティックレビューの「網羅性」を飛躍的に高める 可能性があります。
ただし、コストに注意
GraphRAG のインデックス構築(全文献からエンティティを抽出する工程)は、通常のRAGの100〜1,000倍のLLM推論コストがかかる とされています。これが後述のコスト試算に大きく効いてきます。
3. システム構成 — 何をどう組むのか
Azure 上に構築するシステムの全体像です。研究者の方が「どんなサービスを契約する必要があるのか」をイメージできるよう、具体的なサービス名で記載します。
全体アーキテクチャ(3レイヤー構成)
┌──────────────────────────────────────────────────────────────────┐
│ Azure Resource Group │
│ │
│ ┌─────────────────┐ ┌──────────────────┐ ┌─────────────────┐ │
│ │ Data Ingestion │ │ GraphRAG Core │ │ Query & Analysis│ │
│ │ │ │ │ │ │ │
│ │ Blob Storage │→ │ Azure OpenAI │→ │ Azure AI Foundry│ │
│ │ (文献保管) │ │ (GPT-4o) │ │ (検索UI) │ │
│ │ │ │ │ │ │ │
│ │ Container Apps │ │ Cosmos DB │ │ Global Search │ │
│ │ (MarkitDown) │ │ (知識グラフ) │ │ Local Search │ │
│ └─────────────────┘ └──────────────────┘ └─────────────────┘ │
│ │
│ ┌──────────────────────────────────────────────────────────┐ │
│ │ Key Vault / Monitor / Container Registry / VNet │ │
│ └──────────────────────────────────────────────────────────┘ │
└──────────────────────────────────────────────────────────────────┘
各コンポーネントの役割
| 処理段階 | 何をするか | Azure サービス | 一言で言うと |
|---|---|---|---|
| 文献保管 | PDF/DOCX を格納 | Blob Storage | クラウド上のファイルサーバー |
| 文書変換 | PDF → テキスト(Markdown)に変換 | Container Apps + MarkitDown | Microsoft製の高精度文書変換ツール |
| エンティティ抽出 | 文献から概念・制度・関係を抽出 | Azure OpenAI (GPT-4o) | 最もコストがかかる工程 |
| 埋め込み生成 | テキストをベクトル化 | Azure OpenAI (text-embedding-3-small) | 類似検索のための数値変換 |
| 知識グラフ保存 | エンティティと関係を格納 | Cosmos DB (Gremlin API) | グラフデータベース |
| ベクトル検索 | 類似文献・概念の検索 | Azure AI Search | ハイブリッド検索エンジン |
| 分析UI | 研究者が検索・分析を行う画面 | Azure AI Foundry + Web UI | チャット形式の分析インターフェース |
💡 MarkitDown は Microsoft が公開しているオープンソースツールで、PDFの表・図表・数式なども高精度にテキスト化できます。白書のように複雑なレイアウトの文書に有効です。
4. リアルなコスト試算 — ここが一番知りたいところ
前提条件
| 項目 | 値 | 根拠 |
|---|---|---|
| 対象文献数 | 約6,000件 | OECD 38カ国 × 白書 + 学術論文 |
| 総ページ数 | 約75,000ページ | 6,000件 × 平均12.5ページ |
| 総トークン数 | 約1.5億トークン | 75,000ページ × 2,000トークン/ページ |
| 為替レート | 1 USD = 155 JPY | 2026年4月時点 |
Azure 利用料の内訳
| リソース | 用途 | 月額目安 | 12ヶ月計 |
|---|---|---|---|
| Azure OpenAI (GPT-4o) | エンティティ抽出・サマリ生成 | ¥28,000〜45,000 | ¥336,000〜540,000 |
| Azure Cosmos DB | 知識グラフ保存 | ¥36,000 | ¥432,000 |
| Azure AI Search (S1) | ベクトル検索 | ¥38,000 | ¥456,000 |
| Container Apps | MarkitDown・Indexer | ¥5,000〜15,000 | ¥60,000〜180,000 |
| その他(Storage等) | ファイル保管・監視 | ¥4,000 | ¥48,000 |
| Azure 合計 | ¥113万〜¥125万 |
人件費を含めた総コスト
| カテゴリ | 金額 | 構成比 |
|---|---|---|
| Azure 利用料 | ¥113万〜¥125万 | 9.4〜10.3% |
| 人件費 | ¥1,020万 | 84.6% |
| その他(DB利用料等) | ¥60万 | 5.0% |
| 総計 | 約¥1,200万 / 12ヶ月 | 100% |
📊 最大の発見: コストの84%は人件費
Azure の利用料は ¥113〜125万円で、実はそれほど高くありません。
問題は、GraphRAG パイプラインの構築・チューニング・論点の解釈・計画策定を行う 人的リソースの確保 です。
PI(研究代表者)1名、AIエンジニア1名、データエンジニア1名で、月額約85万円。
これが12ヶ月で約1,000万円になります。
SPReAD1000 の枠(500万円 / 180日)を最大限活かすには?
スコープを戦略的に設計することで、SPReAD1000 の枠内で十分な成果が出せます。
5. SPReAD1000 に最適化した設計
500万円 / 180日の枠を最大限に活かし、意味のある成果を出すための設計です。
何に集中し、何を次フェーズに回すか
| 項目 | 将来的な拡張版 | SPReAD1000 版 | 判断理由 |
|---|---|---|---|
| 対象文献 | 6,000件(38カ国) | 1,000〜2,000件(主要10カ国) | 英語圏 + OECD公式文書に絞る |
| GraphRAG方式 | フルGraphRAG | LazyGraphRAG | インデックスコスト90%削減 |
| 研究期間 | 12ヶ月 | 6ヶ月(180日) | Phase A-C に集中 |
| 人員 | PI + エンジニア2名 + RA | PI 1名 + 技術支援(部分委託) | 既存の研究室リソース活用 |
| 最終成果 | 分析計画書15件 | 未検証論点リスト + 概要レベルの方針 | Phase D は次フェーズで展開 |
SPReAD1000 版の予算案
| カテゴリ | 金額 | 備考 |
|---|---|---|
| Azure 利用料 | ¥40万 | LazyGraphRAG で大幅削減 |
| エンジニア委託費 | ¥300万 | GraphRAGパイプライン構築 3ヶ月 |
| その他 | ¥80万 | 文献DB利用料、学会費等 |
| 合計 | 約¥420万 | SPReAD1000 枠内 ✅ |
縮小版でも出せる成果
削ったのはスケールであって、研究の核は残しています。
| 成果指標 | 本格版 | 縮小版 |
|---|---|---|
| 文献検索対象の拡大 | 従来比50倍 | 従来比10倍 |
| 未検証論点の抽出 | 30-50件 | 10-20件 |
| 分析計画の具体化 | 15件 | 概要レベルで5件 |
| 再現可能なパイプライン | ✅ | ✅(これが最大の資産) |
💡 SPReAD1000 応募のポイント: 縮小版でも「パイプラインが動く」ことを実証できれば、次のフェーズの大型研究費 への布石になります。SPReAD1000 は「AI活用の実証」が目的なので、完全な研究成果よりも 「この手法が機能することの証明」 を前面に出すほうが採択に有利と考えられます。
6. 研究計画の時間軸 — 180日で何をするか
SPReAD1000 の180日(約6ヶ月)に合わせたスケジュールです。
Month: 1 2 3 4 5 6
├────────────────┤
Phase A: データ収集・前処理
├ 文献リスト策定(主要10カ国)
├ PDF/DOCXダウンロード
└ MarkitDown でMarkdown変換
├──────────────────┤
Phase B: GraphRAG構築
├ Azure環境プロビジョニング
├ LazyGraphRAG インデックス構築
└ コミュニティ検出・サマリ生成
├──────────────────┤
Phase C: 論点抽出・分析
├ Global Search で俯瞰分析
├ 日本文献との差分抽出
└ 未検証論点リスト作成
各フェーズの具体的な作業
Phase A(Month 1-2): 文献を集めて整える
- OECD・各国政府サイト・Scopus/PubMedから文献を収集
- Microsoft MarkitDown で PDF → Markdown に一括変換
- 国名・年度・文書種別のメタデータを付与
⚠️ ここでの注意: 各国白書の著作権・利用規約の確認が必要です。OECD文書は比較的オープンですが、各国政府文書は条件が異なります。
Phase B(Month 2-4): AIに「読ませる」
- LazyGraphRAG でエンティティ・関係を抽出(コスト90%削減版)
- Cosmos DB に知識グラフを格納
- Azure AI Search にベクトルインデックスを構築
- コミュニティ検出で「少子化に関するトピック群」を自動分類
Phase C(Month 4-6): 論点を発見する
- Global Search: 「38カ国の少子化対策の主要論点は何か」と問う → コミュニティ横断の俯瞰回答
- 差分分析: 海外文献のコミュニティ vs 日本文献のサブグラフを比較 → 日本に存在しない論点を抽出
- 研究者の専門知識で論点を評価・優先度付け
7. コスト最適化のヒント — 知っておくと得する技
GraphRAG は強力ですが、使い方次第でコストが桁違いに変わります。
LazyGraphRAG を使う(必須)
Microsoft Research が2024年末に発表した LazyGraphRAG は、フルインデックスを事前に構築せず、クエリ時に必要な部分だけ処理する方式です。
| 方式 | 6,000件のインデックスコスト | 品質 |
|---|---|---|
| フル GraphRAG | 約¥25万 | ◎ |
| LazyGraphRAG | 約¥2.5万 | ○(フルの85-90%程度) |
| 通常の RAG | 約¥500 | △(Global質問に弱い) |
SPReAD1000 の予算を最大限に活かすなら、LazyGraphRAG 一択 です。
その他の節約テクニック
| テクニック | 効果 | リスク |
|---|---|---|
| GPT-4o-mini でエンティティ抽出 | 推論コスト 97%削減 | 抽出精度が低下する可能性 |
| Cosmos DB を Serverless に | 月額 ¥36,000 → 利用量次第で大幅減 | 高負荷時にスロットリング |
| AI Search を Basic に変更 | 月額 ¥38,000 → ¥11,000 | インデックスサイズ上限あり |
| 不要時のリソース停止 | Phase A/B 完了後に不要サービス停止 | 再起動時に手間 |
8. 応募に向けて — この設計をどう活用するか
申請書に書くべきこと
SPReAD1000 の申請書で求められるのは「AI活用の必要性」と「実施計画の具体性」です。本記事の内容を以下のように活用できます:
| 申請書の項目 | 本記事で使える内容 |
|---|---|
| AI活用の必要性 | 第1節の「人手の限界」(量・言語・比較・発見の4つの壁) |
| 技術手法の選定理由 | 第2節の「なぜGraphRAGか」(通常RAGとの比較表) |
| システム構成 | 第3節のアーキテクチャ図とコンポーネント表 |
| コスト根拠 | 第4節の Azure 料金内訳(公開価格ベース) |
| 実施計画 | 第6節の Phase A-C タイムライン |
| 期待される成果 | 第5節の「縮小版でも出せる成果」 |
本記事の設計書一式
本記事の元になった詳細設計書をリポジトリで公開しています:
| ファイル | 内容 |
|---|---|
phase0-research-plan.md |
12ヶ月研究プラン(4フェーズ構成) |
phase1-azure-architecture.md |
Azure構成設計書(全コンポーネント詳細) |
phase2-cost-estimate.md |
詳細コスト見積もり(Azure料金ソース付き) |
phase3-proposal.md |
統合プロジェクト計画書 |
system-architecture.drawio |
Azure構成図(Azure公式アイコン使用) |
⚠️ これらは AI が生成した叩き台 です。実際の応募書類にそのまま使うのではなく、ご自身の研究テーマ・専門知識・所属機関の状況に合わせてカスタマイズしてください。特にコスト試算は、Azure Pricing Calculator で最新価格を確認してください。
9. 補足: この設計書はどうやって作ったか
ChatGPT / Claude との壁打ちでは、こうはならない
ここまでの設計書一式を見て、「ChatGPT に頼めば同じものが出るのでは」と思うかもしれません。実際に試してみるとわかりますが、汎用 AI チャットで得られるのは 「それらしい雰囲気の回答」 であり、設計判断に使える精度の情報 ではありません。
| 汎用AIチャットに聞いた場合 | 本記事の設計書 |
|---|---|
| 「Azure AI Search を使います」(料金不明) | S1: 月額¥38,000、Basic: ¥11,000 と最新価格表から根拠付きで比較 |
| 「GraphRAG がおすすめです」(コスト不明) | 通常RAGの100〜1,000倍 のインデックスコストを明示 |
| 「Cosmos DB を使います」(SKU不明) | Autoscale 4,000 RU/s で月額¥36,000、Serverless との比較も提示 |
| 「500万円で可能です」(根拠なし) | 現実は¥1,200万。縮小版で¥420万 とAzure実価格ベースで誠実に算出 |
| 「構成図を作ってください」→ テキスト説明 | Azure公式アイコンの.drawioファイルを自動生成 |
この差が生まれる理由は明確です:
- 技術選定は人間の知見 — 「このユースケースには GraphRAG が必要」という判断は、汎用AIからは出てこない。AI for Science の技術動向を追い続けている実務者だからこそ下せる判断
- 汎用AIは最新料金を知らない — 学習データのカットオフ以降の価格改定を反映できない
- 汎用AIはWebにアクセスしない(多くの場合)— Azure Pricing Calculator の実データを取得できない
- 汎用AIにドメイン知識がない — SPReAD1000 の予算設計・審査観点・スケジュールを考慮した最適な構成を提案できない
- 汎用AIに設計プロセスがない — 「調査 → 分析 → 設計 → 見積もり」を一貫したワークフローで実行できない
つまり、「何を使うべきか」を決めるのは筆者の知見、「それをどう設計書に落とし込むか」を高速化するのが専用エージェント — この両輪があるから約40分で設計書一式が完成します。以下にその仕組みを説明します。
約40分で設計書一式を生成できた仕組み
ツールの全体像 — 3層のAIエージェント連携
研究者の一言
「少子化の各国文献をAIで横断分析したい」
│
▼
┌─────────────────────────────────────────────────────┐
│ SPReAD1000-Builder(応募支援 Agent Skills) │
│ 「SPReAD公募の文脈で何が必要か」を知っている │
│ Azure最適構成設計 / 最新価格表参照の費用概算 │
│ 12スキル: コンテキスト収集 → 研究計画 → Azure設計 │
│ → コスト算出 → 申請書作成 → 最終レビュー │
├─────────────────────────────────────────────────────┤
│ SHIKIGAMI(Deep Research Agent + MCP Server) │
│ 「調べもの → 構造化 → レポート」の品質を保証する │
│ 6フェーズ: 目的探索 → 調査 → 分析 → レポート生成 │
│ 53フレームワーク / 33テンプレート / 11 MCPツール │
├─────────────────────────────────────────────────────┤
│ MUSUBIX2(SDD開発基盤 + MCP Server) │
│ 「アプリケーションを仕様駆動で開発する」基盤 │
│ 26パッケージ / 61 MCPツール / EARS形式の要件管理 │
│ コードグラフ解析 / 形式検証(Lean4) / Wake-Sleep学習 │
└─────────────────────────────────────────────────────┘
│
▼
GitHub Copilot CLI + draw.io MCP Server
(オーケストレーション + Azure構成図の自動生成)
各ツールの役割
SPReAD1000-Builder — SPReAD公募に特化した Agent Skills
npm install spread1000-builder でインストールすると、GitHub Copilot に 12のサブスキル + 2つのカスタムエージェントが追加されます。
最大の特徴は2つ:
- Azure上でのベストな構成を自動設計する — 研究テーマに応じて、適切な Azure サービスの組み合わせ・SKU選定・ネットワーク構成を提案。単に「Cosmos DB を使いましょう」ではなく、「Gremlin API / Autoscale 4,000 RU/s / Serverless との比較」まで踏み込む
- 最新の価格表を参照しながら費用概算を算出する — Azure Pricing Calculator の実データにアクセスし、GPT-4o のトークン単価、AI Search の SKU 別月額、Cosmos DB の RU/s 単価など、設計判断に直結する具体的な金額 を根拠付きで算出。汎用AIチャットが「数万円程度です」と曖昧に答えるのに対し、「S1: 月額¥38,000 vs Basic: 月額¥11,000、インデックスサイズ上限に注意」と比較可能な形で提示
| フェーズ | スキル | 何をしてくれるか |
|---|---|---|
| 0 | context-collector |
1問1答で研究テーマの不足情報を収集 |
| 1 | research-planner |
Web調査を通じたAI活用研究計画の作成 |
| 2 | azure-architect |
研究プランに最適なAzure構成の設計 |
| 3 | diagram-generator |
draw.io MCPによるAzure構成図の生成 |
| 4 | cost-estimator |
Azure料金に基づくコスト見積もり |
| 5 | proposal-writer |
SPReAD公募申請書の作成支援 |
| 6 | final-reviewer |
6審査観点でのスコアリング・提出可否判定 |
| 7 | submission-guide |
AIインタビュー・e-Rad提出の手順案内 |
| 8-9 |
iac-deployer / azure-deployer
|
Bicepテンプレート生成とAzureデプロイ |
| 10 | experiment-guide |
実験手順書の生成 |
| 11 | post-award |
採択後の中間報告・最終報告の管理 |
つまり、応募の準備から採択後の報告まで一貫して支援するツール です。今回の記事では Phase 0〜5 のスキルを使用しました。
SHIKIGAMI — Deep Research Agent
GitHub Copilot の AGENTS.md(Custom Instructions)として機能し、AI Coding Agent を 「構造化されたリサーチエージェント」 に変換します。
- 6フェーズの品質管理: プロジェクト初期化 → プロンプト最適化(6要素分解)→ 目的探索(1Q1A対話)→ Deep Research → フレームワーク分析 → レポート生成
- 53種のコンサルフレームワーク: SWOT、3C、PEST、5Forces など。調査テーマに応じて自動選択
- MCP Server(11ツール): Web検索・ページ訪問・調査結果の自動保存・セマンティック検索など
- 品質ゲート: 各フェーズ間でクオリティチェック。「的外れな調査結果のまま次に進む」を防止
今回は、Azure料金の調査(GPT-4o・AI Search・Cosmos DB等の最新価格取得)とGraphRAGの技術調査にSHIKIGAMIを活用しました。
MUSUBIX2 — Specification Driven Development 基盤
実際のアプリケーション開発では、MUSUBIX2 が 要件定義 → 設計 → 実装 → テスト のワークフローを管理します。
- EARS形式の要件管理: 「When [条件], the system shall [動作]」のような構造化された要件記述
- 100%トレーサビリティ: 要件 ↔ 設計 ↔ コード ↔ テスト間の完全な追跡
- 26パッケージのモノレポ: コードグラフ解析、知識グラフ、形式検証(Lean4)、プログラム合成など
- 61のMCPツール: SDD ワークフロー、知識操作、コード解析、セキュリティスキャンなど
GraphRAG パイプラインや分析UIの実装フェーズでは、MUSUBIX2 が仕様から実装までの品質を保証します。SPReAD1000 で採択された後の開発工程で威力を発揮するツールです。
所要時間
| ステップ | 使用ツール | 所要時間 |
|---|---|---|
| 研究テーマの構造化 | SPReAD1000-Builder + SHIKIGAMI | 10分 |
| 技術・コスト調査 | SHIKIGAMI MCP Server | 2分 |
| 設計書4件の生成 | SPReAD1000-Builder | 5分 |
| Azure構成図の生成 | draw.io MCP Server | 5分 |
| この記事の作成 | SHIKIGAMI MCP Server | 15分 |
| 合計 | 約40分 |
これを人手でやった場合(Azure料金調査で半日、GraphRAG技術調査で1-2日、設計書作成で2-3日、構成図作成で半日)は 約4-6日 かかります。
💡 なぜ汎用AIチャットではなく専用エージェントが必要なのか
ChatGPT や Claude は「何でも答えてくれる汎用ツール」ですが、AI for Science の研究計画策定には「実務者の技術選定眼 × 最新情報へのアクセス × 構造化された設計プロセス」の三位一体が必要です。
- 筆者の知見 が「GraphRAG + LazyGraphRAG + Cosmos DB Gremlin API」という技術選定を決める
- SPReAD1000-Builder が公募の審査観点・予算制約に合わせて設計書を構造化する
- SHIKIGAMI が Web上の最新料金・技術情報にアクセスし、設計書に落とし込む
- MUSUBIX2 が設計書の要件を EARS 形式で管理し、実装との100%トレーサビリティを保証する
「何を使うべきか」は人間が判断し、「どう設計書にするか」はエージェントが高速化する — この役割分担を明確に設計したエージェントスタックだからこそ、約40分で設計書一式が生成できました。汎用AIとの壁打ちでは、たとえ丸一日かけても、技術選定の根拠がない「雰囲気の設計書」しか出てきません。
本記事の作成プロセス自体が、「適切な知見を持つ研究者 × 適切に設計されたAIエージェント」の掛け合わせが研究計画策定を劇的に加速する という SPReAD1000 の趣旨の実証になっています。
まとめ
| 問い | 答え |
|---|---|
| このユースケースは技術的に実現可能か? | Yes — GraphRAG + Azure AI Foundry で構築可能 |
| SPReAD1000(500万円/180日)で実施できるか? | 条件付きYes — 対象を主要10カ国に絞り、LazyGraphRAG を使えば |
| 最大のコスト要因は? | 人件費(84%) — Azure費用は全体の10%程度 |
| 「普通のRAG」ではダメなのか? | このユースケースではダメ — 「未知の論点発見」には GraphRAG の Global Search が必要 |
| SPReAD1000 で最も重視すべき成果は? | 「パイプラインが動く」ことの実証 — 完全な成果より手法の有効性証明 |
SPReAD1000 は、AI for Science の「最初の一歩」を踏み出すための制度です。 500万円で世界を変える研究は難しくても、「このアプローチが使える」ことを実証し、次の大型研究費につなげる — そのための180日と考えれば、十分に意義のあるプロジェクトになるはずです。
応募を検討されている方の参考になれば幸いです。
参考リンク
- Microsoft GraphRAG — 知識グラフベースの RAG フレームワーク
- Microsoft MarkitDown — PDF/DOCX → Markdown 高精度変換
- Azure AI Foundry — AI エージェントのオーケストレーション基盤
- LazyGraphRAG — Microsoft Research — コスト90%削減の GraphRAG 手法
- Azure Pricing Calculator — Azure 料金の見積もりツール
- draw.io MCP Server — Azure構成図の自動生成(700+ Azureアイコン内蔵)
- MUSUBIX2 — Specification Driven Development(SDD)基盤、26パッケージ・61 MCPツール
- SHIKIGAMI — Deep Research Agent Skills + MCP Server
- SPReAD1000-Builder — SPReAD公募支援 GitHub Copilot Agent Skills(12スキル)
⚠️ 免責事項: 本記事の設計書・コスト見積もりは AI が生成した参考資料です。SPReAD1000 への応募にあたっては、応募者ご自身の責任で内容を精査・修正してください。Azure 料金は変動するため、最新の Pricing Calculator で確認することを推奨します。文部科学省の公式情報は SPReAD1000 公式サイト でご確認ください。