MarkdownはAI処理に適したフォーマット
業務で作成したパワーポイントやエクセルの資料をAIに処理させたり、watsonx OrchesrateのようなAIエージェント基盤で活用したいことは良くありますが、独自のファイル形式のため、そのまま処理するにはいろいろと課題があります。そこで、前処理としてMarkdown形式に変換する手法が良く使われます。この記事では、マークダウンへの変換ライブラリであるdoclingのMCPサーバーであるdocling-mcp-serverを使用して、IBM Bobを用いてPowerPointファイルをMarkdown形式に変換する方法を紹介します。
docling-mcp-serverとは
docling-mcp-serverは、IBMが提供するDoclingドキュメント変換ライブラリをMCPサーバーとして実装したものです。以下の特徴があります:
- 多様なドキュメント形式に対応: PDF、DOCX、PPTX、HTML等
- 高品質な変換: テーブル、画像、レイアウトを保持
- Markdown/JSON出力: 構造化されたデータとして出力
- ローカルキャッシュ: 変換結果を効率的に管理
- 編集機能: 変換後のドキュメントを編集可能
MCPサーバーの構成方法
1. docling-mcp-serverのインストール
docling-mcp-serverはuvxを使用して簡単に起動できます:
uvx --from=docling-mcp docling-mcp-server
2. IBM BobでのMCP設定
IBM Bobの設定ファイル(mcp_settings.json)にdoclingサーバーを追加します。以下のような構成を追加します。
{
"mcpServers": {
"docling": {
"command": "uvx",
"args": ["--from=docling-mcp", "docling-mcp-server"]
}
}
}
3. 利用可能なツール
docling-mcp-serverは17個のツールを提供します。代表的なツールは以下の通りです。
| ツール名 | 説明 |
|---|---|
convert_document_into_docling_document |
ドキュメントを変換してキャッシュに保存 |
export_docling_document_to_markdown |
Markdown形式でエクスポート |
save_docling_document |
MarkdownとJSON形式でディスクに保存 |
get_overview_of_document_anchors |
ドキュメント構造の概要を取得 |
search_for_text_in_document_anchors |
ドキュメント内のテキスト検索 |
add_paragraph_to_docling_document |
段落を追加 |
add_table_in_html_format_to_docling_document |
HTMLテーブルを追加 |
実践:PowerPointをMarkdownに変換
PowerPointファイルを変換してみます。IBM Bobで以下のように、変換を依頼します。
doclingでpptを変換して
まず、次のようにconvert_document_into_docling_documentツールが実行されます。

変換が成功すると、ドキュメントキーが返されます。次にBobがexport_docling_document_to_markdownツールを呼びだし、Markdown形式でエクスポートします:

変換されたMarkdownは以下のような構造で出力されます:
# watsonx Orchestrate x IBM Bob
# IBM Bobを用いたエージェント開発
IBMの提供するAIエージェント主導開発プラットフォームである...
watsonx OrchestrateはADKの使用方法を提供するMCPサーバーと...
| 名前 | 概要 |
|------|------|
| sop-builder | ワークフロー図、Langflow JSON... |
変換結果の特徴
docling-mcp-serverによるパワーポイントファイルの変換では、以下の要素が適切に処理されました。
画像が多用されているスライドでは、一部テキストの抽出順序が前後するケースも見受けられましたが、全体としては十分に実用的な精度で出力されました。
✅ 保持される要素
- 見出し構造: スライドタイトルが適切な見出しレベルに変換
- テーブル: Markdown形式のテーブルとして出力
- リスト: 箇条書きや番号付きリストを保持
- テキストフォーマット: 太字、斜体などの基本的な書式
⚠️ 制限事項
-
画像:
<!-- image -->というプレースホルダーで表示 - 複雑なレイアウト: 単純なMarkdown構造に変換
- アニメーション: 静的なコンテンツとして出力
Bobに「埋め込まれている画像を分析して概要をマークダウンに含めて」と依頼したところ、ブラウザでファイルを開きキャプチャして内容をまとめて出力してくれました。最近のLLM(VLM)は画像処理の精度も高いので、画像としてAIに説明させるというアプローチも十分現実的になってきました。なお、doclingにはOCRのモジュールも含まれ画像からのテキスト抽出も可能です。
まとめ
docling-mcp-serverを使用することで、PowerPointファイルを簡単にMarkdown形式に変換できます。IBM Bobとの統合により、対話的な操作で効率的にドキュメント変換を実行することができました。AIにドキュメントを処理させるという観点では、マークダウンやHTML/cssで説明資料を作ることも今後は増えてきそうな気もしますが、まだまだパワーポイントを使うことも多いので、活用していきたいと思います。