AIエージェント(ClaudeやCursor)を使って開発していると、必ず「モデルの壁」にぶつかる。標準搭載されているモデルだけでは、最新のDeepSeek-V3のような強力な推論能力が足りなかったり、特定のタスクのために別のWebサイトへ移動して画像生成を行わなければならなかったりするからだ。
複数のAPIを使い分けるのは、開発フローを断片化させる。私はこの「コンテキストのスイッチング」による生産性の低下を解消したかった。そこで、DeepInfraのサーバーレス推論インフラをMCP(Model Context Protocol)経由でエージェントに直接接続する構成をとった。
複数の機能を一つのツールセットに集約する
DeepInfra MCPを使用すると、AIエージェントが単なるチャットボットではなく、強力な推論・生成エンジンを持つ「実行環境」へと進化する。具体的には、以下のツールをエージェントから直接叩けるようになる。
-
create_chat_completion:
deepseek-ai/DeepSeek-V3やmeta-llama/Llama-3.3-70B-Instructといった最新のLLMへアクセスできる。複雑なロジックの検討や、標準モデルでは対応しきれない高度な推論が必要な際、エージェント自身にこれらのモデルを選択させることが可能だ。 -
generate_image:
black-forest-labs/FLUX-1-schnellなどの高品質な画像生成モデルを呼び出せる。例えば「このUI設計に基づいたサイバーパンクな街並みのイメージを作って」と指示するだけで、エージェントが画像を生成し、その結果をそのまま会話に組み込んでくれる。 -
create_embedding: RAG(検索拡張生成)のパイプラインを構築したいとき、
BAAI/bge-large-en-v1.5を使ってテキストをベクトル化できる。エージェントが自らドキュメントを読み込み、埋め込みを作成して知識ベースを更新するプロセスが実現する。 - run_native_inference: OpenAIの仕様に縛られない特殊なタスク(Whisperによる音声文字起こしやOCRなど)も実行可能だ。
複雑なインフラ管理は不要
通常、これらのモデルを自前で動かそうとすれば、GPUのプロビジョニングやスケーリングといった面倒な運用コストが発生する。しかし、このMCPサーバーはDeepInfraのサーバーレスインフラを利用しているため、開発者は推論リクエストを送るだけで済む。
セットアップも極めてシンプルだ。Vinkiusプラットフォームを使い、接続トークンを取得してClaudeやCursorに貼り付けるだけ。3ステップで完了する。
まとめ
開発ワークフローにおいて、AIエージェントに「目(画像生成)」と「高度な思考(最新LLM)」、そして「記憶の整理能力(Embeddings)」を与えることは、単なる機能追加以上の意味を持つ。ツールを切り替える時間を削り、エージェントの中に全ての推論リソースを集約させること。これが次世代のAI駆動開発における鍵になる。
MCPはAIエージェントの音楽。カタログを構築しました。Vinkius MCPカタログを発見してください。