2
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

docling-mcp-serverをIBM Bobから使ってpptxをMarkdownに変換してみる

2
Last updated at Posted at 2026-04-13

MarkdownはAI処理に適したフォーマット

業務で作成したパワーポイントやエクセルの資料をAIに処理させたり、watsonx OrchesrateのようなAIエージェント基盤で活用したいことは良くありますが、独自のファイル形式のため、そのまま処理するにはいろいろと課題があります。そこで、前処理としてMarkdown形式に変換する手法が良く使われます。この記事では、マークダウンへの変換ライブラリであるdoclingのMCPサーバーであるdocling-mcp-serverを使用して、IBM Bobを用いてPowerPointファイルをMarkdown形式に変換する方法を紹介します。

docling-mcp-serverとは

docling-mcp-serverは、IBMが提供するDoclingドキュメント変換ライブラリをMCPサーバーとして実装したものです。以下の特徴があります:

  • 多様なドキュメント形式に対応: PDF、DOCX、PPTX、HTML等
  • 高品質な変換: テーブル、画像、レイアウトを保持
  • Markdown/JSON出力: 構造化されたデータとして出力
  • ローカルキャッシュ: 変換結果を効率的に管理
  • 編集機能: 変換後のドキュメントを編集可能

MCPサーバーの構成方法

1. docling-mcp-serverのインストール

docling-mcp-serverはuvxを使用して簡単に起動できます:

uvx --from=docling-mcp docling-mcp-server

2. IBM BobでのMCP設定

IBM Bobの設定ファイル(mcp_settings.json)にdoclingサーバーを追加します。以下のような構成を追加します。

{
  "mcpServers": {
    "docling": {
      "command": "uvx",
      "args": ["--from=docling-mcp", "docling-mcp-server"]
    }
  }
}

3. 利用可能なツール

docling-mcp-serverは17個のツールを提供します。代表的なツールは以下の通りです。

ツール名 説明
convert_document_into_docling_document ドキュメントを変換してキャッシュに保存
export_docling_document_to_markdown Markdown形式でエクスポート
save_docling_document MarkdownとJSON形式でディスクに保存
get_overview_of_document_anchors ドキュメント構造の概要を取得
search_for_text_in_document_anchors ドキュメント内のテキスト検索
add_paragraph_to_docling_document 段落を追加
add_table_in_html_format_to_docling_document HTMLテーブルを追加

実践:PowerPointをMarkdownに変換

PowerPointファイルを変換してみます。IBM Bobで以下のように、変換を依頼します。

doclingでpptを変換して

まず、次のようにconvert_document_into_docling_documentツールが実行されます。
image.png

変換が成功すると、ドキュメントキーが返されます。次にBobがexport_docling_document_to_markdownツールを呼びだし、Markdown形式でエクスポートします:
image.png

変換されたMarkdownは以下のような構造で出力されます:

# watsonx Orchestrate x IBM Bob 

# IBM Bobを用いたエージェント開発

IBMの提供するAIエージェント主導開発プラットフォームである...

watsonx OrchestrateはADKの使用方法を提供するMCPサーバーと...

| 名前 | 概要 |
|------|------|
| sop-builder | ワークフロー図、Langflow JSON... |

変換結果の特徴

docling-mcp-serverによるパワーポイントファイルの変換では、以下の要素が適切に処理されました。
画像が多用されているスライドでは、一部テキストの抽出順序が前後するケースも見受けられましたが、全体としては十分に実用的な精度で出力されました。

✅ 保持される要素

  • 見出し構造: スライドタイトルが適切な見出しレベルに変換
  • テーブル: Markdown形式のテーブルとして出力
  • リスト: 箇条書きや番号付きリストを保持
  • テキストフォーマット: 太字、斜体などの基本的な書式

⚠️ 制限事項

  • 画像: <!-- image -->というプレースホルダーで表示
  • 複雑なレイアウト: 単純なMarkdown構造に変換
  • アニメーション: 静的なコンテンツとして出力

Bobに「埋め込まれている画像を分析して概要をマークダウンに含めて」と依頼したところ、ブラウザでファイルを開きキャプチャして内容をまとめて出力してくれました。最近のLLM(VLM)は画像処理の精度も高いので、画像としてAIに説明させるというアプローチも十分現実的になってきました。なお、doclingにはOCRのモジュールも含まれ画像からのテキスト抽出も可能です。

まとめ

docling-mcp-serverを使用することで、PowerPointファイルを簡単にMarkdown形式に変換できます。IBM Bobとの統合により、対話的な操作で効率的にドキュメント変換を実行することができました。AIにドキュメントを処理させるという観点では、マークダウンやHTML/cssで説明資料を作ることも今後は増えてきそうな気もしますが、まだまだパワーポイントを使うことも多いので、活用していきたいと思います。

2
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?