1枚の画像が動き出す!Vertex AIの動画生成AI「Veo」で動画を作ってみた
対象読者
- Google CloudのVertex AI、特に動画生成に興味がある方
- 画像生成AIの次に、動画生成AIを触ってみたいエンジニアやクリエイター
- プロンプトエンジニアリングの勘所を動画生成で掴みたい方
TL;DR
Vertex AIの動画生成モデル「Veo」は、①基準となる画像 と ②テキストプロンプト を組み合わせることで、高品質な動画を生成できるスゴいAI。業務ではなかなか使う機会のない、けど興味はある動画生成について、実際に生成するまでの体験をまとめてみました!
1. Vertex AIと最先端の動画生成モデル「Veo」
まず、今回の主役となる技術について少し詳しく見ていきましょう。
Vertex AIとは?
Vertex AIは、Google Cloudが提供するフルマネージドの統合AIプラットフォームです。機械学習モデルの開発、トレーニング、デプロイ、管理といった一連のライフサイクルを、単一のプラットフォーム上でシームレスに行うことができます。
Googleの公式ドキュメントでは、以下のように説明されています。
Vertex AI は、Google Cloud 上で ML モデルと AI アプリケーションをビルド、デプロイ、スケーリングするためのプラットフォームです。Vertex AI は、ML プロジェクトのライフサイクル全体でモデルとアプリを管理するため、ツール、ワークフロー、インフラストラクチャを統合します。
(Vertex AI の概要 | Google Cloud)
つまり、Googleが持つ強力なAI技術を、私たち開発者が手軽に利用するための「キッチンのような場所」と言えます。
Veoとは?
Veoは、そのVertex AIというキッチンで使える、Googleで最も高性能な動画生成モデルです。テキストや画像から、高品質でリアルな動画を生成する能力を持っています。
Veoの特徴は、プロンプト(指示)に対する高い忠実性です。
Veo は、高品質の 1080p 動画を生成し、1 分を超える長さの動画を作成できます。動画は、さまざまな映像スタイルと視覚スタイルに対応しています。(中略)このモデルは、プロンプトのニュアンスを正確に反映し、一貫性のあるリアルな動画を生成します。
(Vertex AI の生成 AI の概要 | Google Cloud)
今回は、このVeoが持つ「画像とテキストから動画を生成する」機能を使って、1枚の人物写真からオリジナルのPVを作成していきます。
2. Veoによる動画生成の実践ステップ
ここからは、実際の操作画面のスクリーンショットを使いながら、手順を一つずつ解説します。
Step 0: 前提
- Google Cloudアカウント、プロジェクトが作成済みであること。
- 動画生成を行いたいGoogle Cloudプロジェクトが選択されていること。
- 保存先のCloud Storageバケットを用意しておくこと。
- プロジェクトで Vertex AI APIが有効になっていること。
Step 1: Vertex AI Studioへのアクセス
まず、Google Cloudコンソールにログインします。
画面上部の検索窓から Vertex AI を検索し、Vertex AI Studioに遷移します。
そして、左側のバーからGenarate mediaを選択し、その後の画面ではVeo Genarate videoを選択します。
※UIは、変わる可能性があるので、あくまで2025/10時点での操作と思ってください。
▼ Vertex AI > Genarate media > Veo Genarate video をクリック

Step 2: プロンプトと画像の設定(最重要ポイント)
ここから実際に動画を生成するためのプロンプトの入力や設定をしていきます。
① プロンプトの入力
中央下の大きなテキストボックスに、生成したい動画のイメージを具体的に記述します。ここで重要になるのがプロンプトの具体性です。「格好いい動画」といった抽象的な指示ではなく、AIが映像を思い浮かべられるように、詳細な情報を与えてください。
プロンプト作成のコツ:
-
誰が/何が (Who/What):
(アップロードした画像の人物が) -
どこで (Where):
未来都市のような東京・豊洲の夜景を一望できる、高層ビルのガラス張りの展望デッキに立っている -
何をしている (What doing):
真剣な眼差しで遠くを見つめる -
雰囲気/スタイル (Atmosphere/Style):
彼の周りをデジタルな光の線が流れ、足元の床にはデータが流れるようなプロジェクションマッピングが映し出されている -
カメラワーク (Camerawork):
ドローンがゆっくりと彼から引いていき、壮大な都市の景色を映し出す
これらの要素を組み合わせ、今回は以下のプロンプトを試してみました。
アップロードした画像の人物が未来都市のような東京・豊洲の夜景を一望できる、高層ビルのガラス張りの展望デッキに立っている。背景にはライトアップされたレインボーブリッジ。彼の周りをデジタルな光の線が流れ、足元の床にはデータが流れるようなプロジェクションマッピングが映し出されている。真剣な眼差しで遠くを見つめる。ドローンがゆっくりと彼から引いていき、壮大な都市の景色を映し出す。
② 基準画像のアップロードとTypeの選択
次に、動画の主役となる人物の画像をAIに教えます。
- プロンプト入力欄の右にある「Uploadボタン」をクリックします。
- PCから、主役にしたい人物が写った画像ファイルを選択してアップロードします。
Step 3: パラメータの調整
画面右側のパネルで、生成する動画の細かい仕様を決めます。
-
モデル (Model):
Veo 3 Previewを選択します。他のモデルとして、Fastは生成が速く低コストですが、品質は若干落ちます。テスト段階ではFastがおすすめです。(ただし、画像のアップロードはVeo 3 Previewしかできない?) - 動画の長さ (Duration): 生成する動画の秒数を指定します。料金はこの長さに比例して変動します。 今回は、8秒程度の時間でプロンプトを実行してみました。
- シード (Seed): 生成結果を固定したい場合に使用する数値です。空欄のままだと、同じプロンプトでも毎回少し違う動画が生成されます。(Advanced Optionsとして設定可能です!)
Step 4: 生成と結果の確認
すべての設定が完了したら、画面右下の「生成」ボタンをクリックします。
数分待つと、画面右側にプレビューが表示されます。
再生ボタンで内容を確認し、イメージ通りの動画ができていれば「ダウンロード」ボタンからMP4形式で保存できます。(保存先のCloud Storageを設定しておけば、そちらに保存されます)
TIPS(もしエラーが出たら):
私が、実際に試した際には、実行時に以下のようなエラーが発生しました。
これは安全ガイドラインに関するエラーであり、プロンプトに含まれるワードがこのガイドラインに抵触する場合に、生成に失敗するようです。ですので、そのような場合にはプロンプトの中身を見直すか、「Safety」の設定を見直してみましょう。(私はそれで無事実行できました。)
応答の取得に失敗しました。
プロンプトを送信できませんでした。このプロンプトには、Vertex AI の使用ガイドラインに違反する単語が含まれています。プロンプトの言い回しを変更してみてください。エラーだと思われる場合は、フィードバックをお送> りください。サポートコード: 29310472
3. 完成した動画と今後の可能性
こうして、たった1枚の静止画から、未来都市を背景にしたクールなPV風動画を生成することができました!
私もまだ慣れていないので、イマイチに感じる部分はもちろんあるのですが、特別な動画編集、CGのスキルがなくても、プロンプトと画像だけでこれだけのクオリティの映像が作れるのは驚きです。ショート動画の素材作成、製品やサービスのコンセプトムービー、プレゼンテーションのオープニング映像など、ビジネスからクリエイティブまで、様々な分野での活用が期待できます。
4. まとめ
- Vertex AIの「Veo」は、画像と詳細なテキストプロンプトを組み合わせることで、誰でも手軽に高品質な動画を生成できる強力なツールです。
- 成功の鍵は、AIが映像を具体的にイメージできるよう詳細なプロンプトを記述することと、基準画像の役割を**
Subjectとして正しく指定**することです。 - 料金は動画の長さに比例するため、色々試されたい場合は、短い秒数でテストを繰り返すのが効率的です。
この記事が、皆さんの動画生成AIライフの第一歩となれば幸いです!


