はじめに
GoogleのNotebookLMに実装された「インフォグラフィック生成機能」は、論文の要約を視覚化する強力なツールです。
しかし、単に「論文情報を抽出して図にして」と指示するだけでは、LLM特有のハルシネーション(幻覚) が発生し、特に書誌情報(タイトルや著者名)において架空のデータを生成するリスクがあることが判明しました。
本記事では、「情報の抽出(Logic)」と「描画(Creative)」を分離するプロンプトエンジニアリングを行い、実際の論文(Yokota et al. PLOS ONE 2024)を用いて4つのパターンで生成挙動を検証しました。
検証の背景:Yamakawa事件
以前、変数を固定せずに生成を行った際、論文に全く存在しない "Yamakawa et al." という架空の著者名がヘッダーに描画される現象(通称:Yamakawa事件)に遭遇しました。
これは、画像生成モデルがプロンプト内のプレースホルダー [ ] を「変数」としてではなく、**「デザイン上のテクスチャ」**として認識し、学習データから確率的にそれっぽい文字列を補完してしまうために起こると推測されます。
検証実験:4つのプロンプトパターン
同一の論文(Yokota et al. PLOS ONE 2024)に対し、指示の具体性と変数の扱いを変えて比較しました。
使用論文(オープンアクセス):https://pubmed.ncbi.nlm.nih.gov/38753862/
Pattern 1: 指示なし (Baseline)
プロンプトを与えず、デフォルト機能のみで生成。
- 結果: レイアウトが制御されず、ポスターのような散漫な見た目。書誌情報も欠落。
Pattern 2: 変数未固定 (The Trap)
レイアウト指示は与えるが、ヘッダー情報は [筆頭著者名] のまま、本文データも [抽出] というプレースホルダーのまま指示。
-
挙動: AIが
[ ]をどう解釈するかが運任せになる。 - リスク: 過去の検証ではここでハルシネーションが発生。今回は偶然成功する場合もあるが、安定しない。
Pattern 3: 一気通貫指示 (One-Shot)
「抽出して書き換えろ」という指示を1つのプロンプト内で完結させる手法。
- 結果: 比較的良好な結果が出たが、これは**「ラッキーヒット」**である可能性が高い。
-
分析: 複雑な論文の場合、推論リソース不足により
[抽出]という文字がそのまま画像に出力されたり、データが欠落するリスクが残る。
Pattern 4: 2段階指示 (The Golden Standard)
「チャットで抽出」→「プロンプトに固定(ハードコーディング)」 という手順を踏んだもの。
-
結果:
- ヘッダー: "Yokota et al. PLOS ONE..." と一言一句正確に反映。
- データ: 「平均年齢60歳超」「P<0.0001」など、具体的な数値データが正確に配置された。
- レイアウト: 完全な3カラム構成を維持。
技術的解剖:なぜPattern 4なのか?
画像生成AIに対し、「考えて探せ(Search)」と「描け(Draw)」を同時に求めると負荷がかかります。
Pattern 4では、以下のように責務を分離しました。
-
Logic Phase (Chat): テキスト生成モデルに情報の抽出のみを行わせる。
- 入力:
論文の「タイトル」「筆頭著者名」...を抽出してください。
- 入力:
-
Creative Phase (Prompt): 抽出された情報を**「定数(文字列)」**としてプロンプトに埋め込む。
- 入力:
ヘッダーテキスト: Yokota et al. PLOS ONE 2024
- 入力:
これにより、画像生成モデルは「文字を探す」計算リソースを節約でき、「レイアウトとデザイン」に全リソースを集中できるため、クオリティが劇的に向上します。
実装コード(プロンプトテンプレート)
今回確立した、Markdown形式のプロンプトテンプレートを公開します。
Logic Phaseで情報を得た後、# 2. ヘッダー および # 3. メインエリア の内容を書き換えて使用してください。
あなたは医学論文の解説を行う熟練のメディカルライター兼デザイナーです。
読み込んでいる論文の内容を元に、以下の【デザイン仕様】と【コンテンツ構成】に従って、A4サイズ1枚に要約した**視覚的なインフォグラフィック**を作成してください。
# 1. デザインコンセプト (Design Spec)
- **レイアウト**: 画面を**「ヘッダー」**と、その下の**「3つの縦長カラム(左・中・右)」**に分割する構成を厳守してください。
- **配色**:
- 背景全体: 薄いグレー (#F3F4F6)
- ヘッダー背景: ダークグレー (#374151)
- 重要箇所(中央カラム見出し等): 青 (#2563EB)
- **アイコン**: 各項目の冒頭には、内容に適した**絵文字(Emoji)**を使用してください(例: 👥, 📊, 🏥)。
# 2. ヘッダー (上部エリア)
**背景**: 濃いグレーで塗りつぶし、白文字で以下を中央揃えにしてください。
- **メインタイトル**: 英語の原文タイトル(最も大きく表示)
- **論文情報**: 読み込んでいる論文の**実際の書誌情報**を特定し、以下の形式で**具体的なテキスト**として記述してください。
- テキスト: (ここにチャットで抽出した書誌情報をコピペする。例: Yokota et al. PLOS ONE Vol.19(5) 2024)
# 3. メインエリア (下部3カラム構成)
以下のように3つのカラムを横並びに配置し、情報を整理してください。
### 【左カラム】SETTING (幅30% / 背景: 薄いグレー)
- **見出し**: 「SETTING」
- **内容**: 以下の項目を論文から正確に抽出し、**日本語で**簡潔に記載してください。
- 📝 **Study design**: (ここにチャットで抽出した情報をコピペ)
- 👥 **Population**: (ここにチャットで抽出した情報をコピペ)
- 🚫 **Exclusion criteria**: (ここにチャットで抽出した情報をコピペ)
- 🏥 **Data source / Setting**: (ここにチャットで抽出した情報をコピペ)
- ✅ **Primary outcome**: (ここにチャットで抽出した情報をコピペ)
- 🎯 **Key secondary outcomes**: (ここにチャットで抽出した情報をコピペ)
- 📊 **Statistical methods**: (ここにチャットで抽出した情報をコピペ)
### 【中央カラム】KEY RESULTS (幅40% / 背景: 白 / 強調)
- **見出し**: 「KEY RESULTS」(青背景・白文字)
- **内容**:
- 論文の**最も重要な結果(数値データ)**を大きく太字で表示してください。
- 以下の数値を**視覚的なバー**や**強調ボックス**を用いて目立たせてください。
- (ここにチャットで抽出した「重要な数値データ1」をコピペ)
- (ここにチャットで抽出した「重要な数値データ2」をコピペ)
- (ここにチャットで抽出した「重要な数値データ3」をコピペ)
### 【右カラム】DISCUSSION (幅30% / 背景: 薄いグレー)
- **見出し**: 「DISCUSSION / CONCLUSION」
- **内容**: 以下の3セクションを縦に並べて、**日本語で**記述してください。
1. **| DISCUSSION**: (ここにチャットで抽出した考察要約をコピペ)
2. **| LIMITATION**: (ここにチャットで抽出した限界点をコピペ)
3. **| CONCLUSION**: (ここにチャットで抽出した結論をコピペ)




