AI動画生成で話題のGen-2を使って静止画上の人物を指定方向へと歩かせてみたりした

Posted at 2024-02-13

Supershipの名畑です。ダンジョン飯は本当に安心して楽しめますね。冷静に考えたなら、かなりデンジャラスな内容なのに。

はじめに

RunwayのGen-2という動画生成ツールの話題を目にしたため、使ってみたという記事です。

Runway is an applied AI research company shaping the next era of art, entertainment and human creativity.

Runwayのサイトには上記のように書かれています。訳すと「Runwayはアート、エンターテイメント、人間の創造性の新時代を形作る応用AI研究会社です」といったところでしょうか。
過去にはStability.aiと組んで画像生成のStable Diffusionを共同リリースしたということで有名ですが、今は独自サービスの展開を行なっているそうです。

今回の記事においてGen-2で行うのは

テキストからの動画生成を2パターン
静止画からの動画生成
静止画の一部分のみを動画化

の合計4パターンとなります。

前提

実際の生成物はmp4ですが、アニメーションGIFに変換したものを掲載しています。
画像は容量の関係で解像度並びに画質をかなり落としてあります。実際はもっと鮮明です。

Runway

Runwayという社名と同名のプラットフォームがあり、そこでは生成AIを活用したツールが30以上提供されています。Gen-2はそのうちの一つです。

代表的なものとしては以下のツールがあります。

Gen2(Text/Image to Video)
Gen1(Video to Video)
Remove Background
Text to Image
Image to Image
Text to Speech

iOSアプリやDiscordでも利用可能なようですが、今回はブラウザ版で進めます。

アカウント作成

Sign upのページからアカウントを作成します。

E-mailアドレスを用いての登録のほかにGoogleアカウント、Appleアカウントも利用できます。
EnterpriseプランではSSOも対応しているそうです。

ログインするとDashboardが表示されます。

料金

Each second of video generation uses 5 credits, and you have 525 credits left. upgrade to get more credits.

1秒の動画を生成するために5クレジットが必要だそうです。
アカウント作成時に525クレジットが付与されました。つまり125秒分です。

以下の5つのプランがあります。年払いだと20% offです。今回は無料のBasicで進めます。

Basic：無料、125クレジット/月
Standard：$15/月、625クレジット/月
Pro：$35/月、2250クレジット/月
Unlimited、$95/月、ビデオ生成無制限
Enterprise：大規模なチーム、組織向けのカスタム

クレジット数等のビデオ生成に関するもの以外にも違いがありますので詳しくはpricingをご覧ください。

Gen-2の設定項目

トップページからGen-2のページに移動します。

TEXT、IMAGE、IMAGE + DESCRIPTIONの3つが選べますが、まずはTEXTでやってみることにします。

設定項目としては保存先(Private or Shared)の他に以下が変更可能ですが、まずはデフォルトのままとします。

Seed：シード値
Interpolate：フレームのスムースアウト有無、デフォルトは有
Upscale(有料プランのみ)：高解像度化
Remove watermark(有料プランのみ)：透かしの削除
Generatl Motion：動きの強さ(0〜10)、デフォルトは5
Camera Motion：カメラの動き(-10〜10)、デフォルトはすべて0
- Horizontal
- Pan
- Roll
- Vertical
- Tilt
- Zoom
Add Style：スタイル追加、デフォルトは無し
- 3D Cartoon、SD Renderなど33種類
比率：デフォルトは16:9
- 16:9
- 9:16
- 1:1
- 4:3
- 3:4
- 21:9