はじめに
MCP Servers for Google Cloud Genmedia APIs とは、 Google Cloud の生成メディア API(Imagen、Veo、Chirp、Lyria)とオーディオ/ビデオ合成機能(AVTool)を活用できるようにする MCP サーバーです。
以下の機能が MCP サーバーの機能としてあります。
- Imagen
- テキストプロンプトから画像を生成および編集
- Veo
- テキストまたは画像からビデオを作成
- Chirp 3 HD
- テキストから高品質のオーディオを合成
- Lyria
- テキストプロンプトから音楽を生成
- AVTool
- オーディオ/ビデオの合成と操作 (例: 結合、連結、形式変換) を実行
今回はこの MCP サーバーを Gemini CLI から呼び出して使用してみたいと思います。
インストール
MCP Servers for Google Cloud Genmedia APIs のリポジトリからインストールします。
git clone https://github.com/GoogleCloudPlatform/vertex-ai-creative-studio.git
cd vertex-ai-creative-studio/experiments/mcp-genmedia/mcp-genmedia-go
./install.sh
すると、どの MCP サーバーをインストールするか選択します。
Please choose an MCP server to install:
1) mcp-avtool-go
2) mcp-lyria-go
3) mcp-imagen-go
4) mcp-chirp3-go
5) mcp-veo-go
6) Install All
7) Exit
認証
MCP サーバーは Google のアプリケーションデフォルト認証情報(ADC)を使用して認証を行います。
2つの方法で認証を行えます。
1つ目が ADC をセットアップする方法。
gcloud auth application-default login
2つ目がサービスアカウントキーを使用する方法。
GOOGLE_APPLICATION_CREDENTIALS
環境変数をサービスアカウントキーファイルのパスに設定します。
設定
Google Cloud プロジェクト ID を PROJECT_ID
環境変数として設定しておきます。
export PROJECT_ID=$(gcloud config get project)
実行
ローカルに保存
今回は Gemini CLI から実行してみます。
~/.gemini/settings.json
に MCP サーバーの設定を記載します。
{
"mcpServers": {
"imagen": {
"command": "mcp-imagen-go",
"env": {
"MCP_SERVER_REQUEST_TIMEOUT": "300",
"PROJECT_ID": "{PROJECT_ID}"
}
}
}
}
Gemini CLI を起動して、/mcp
コマンドで MCP サーバーの状況を確認します。
画像生成の MCP サーバーが準備状態になっていることが確認できます。
プロンプトを入力し、実行します。
ツールの使用の許可をします。
期待通りの画像が出力されました!
Create an image of a cat flying around space

GCS に保存
生成画像を Cloud Storage に保存することも可能となっています。
ユーザーまたはサービスアカウントに ロールroles/storage.objectUser
を付与しておきます。
MCPサーバーのGENMEDIA_BUCKET
環境変数を設定します。
{
"mcpServers": {
"imagen": {
"command": "mcp-imagen-go",
"env": {
"MCP_SERVER_REQUEST_TIMEOUT": "300",
"PROJECT_ID": "{PROJECT_ID}",
"GENMEDIA_BUCKET": "{BUCKET_NAME}"
}
}
}
}
同様にプロンプトを入れて、実行します。
指定したバケットに画像が保存されたとなります。
実際に保存されていた画像です。
Create an image of a dog flying around space

まとめ
MCP Servers for Google Cloud Genmedia APIs を使用して、MCP サーバーで画像を生成してみました。
Gemini CLI から MCP サーバーを呼び出して使用しました。
Gemini CLI と MCP Servers for Google Cloud Genmedia APIs は、Google Cloud のサービスということもあり親和性が高そうだと感じました!