Supershipの名畑です。今期アニメの正反対な君と僕は内容もEDもすごく好きなんですが、OPがトップレベルに好き。
はじめに
年末にNano Banana Proに生成が難しそうな画像を作ってもらい、Veo 3.1で動画化してみたと言う記事を書きました。
当時も今も話題になっているNano Banana Proで生成した画像をVeo 3.1で動画にしたという内容です。どちらもGoogle製ですね。
今回は、先月リリースされたRunway Gen-4.5がついにImage-to-Videoにも対応されましたので、比較してみようと思います。
AI開発企業のRunwayが動画生成AI「Runway Gen-4.5」を2025年12月1日に発表しました。Runway Gen-4.5はプロンプト追従性や物理現象の再現性能が向上しており、GoogleのVeo 3やOpenAIの Sora 2を上回る性能を示しています。
参考:動画生成AI「Runway Gen-4.5」が登場、OpenAIのSora 2やGoogleのVeo 3より高性能 - GIGAZINE
最近では生成AIの活用も多岐に亘ってきており、モデルの性能を素で比較することの意味の重みも変わってきてはいますが、なにかの参考になればと思います。
前回記事とまったく同じ画像、まったく同じプロンプトで動画を生成する形で進めます。
刀削麺を食べるメデューサ
元画像(前回記事同様)
プロンプト(前回記事同様)
Medusa eating knife-cut noodles
日本語訳すると「刀削麺を食べているメデューサ」です。
Veo 3.1での生成動画(前回記事同様)
Runway Gen-4.5での生成動画
麺を食べるという動作が滑らかであること、それと、頭の蛇の一本一本がオブジェクトとして認識されているのが素晴らしいです。麺が長すぎるかなという違和感はありますが。
また、試行回数の問題でたまたまかもしれませんが、途中から刀削麺の文字が消えて別の字になってしまうことがマイナス要素でしょうか。
コンタクトレンズを目にはめるポリュペーモス
元画像(前回記事同様)
プロンプト(前回記事同様)
Polyphemus putting on a large contact lense in a clean men's restroom
日本語訳すると「きれいな男子トイレで大きなコンタクトレンズをはめるポリュペーモス」です。
前記事同様、lenseをスペルミスしてしまっているままとなります(正しいのはlens)。
Veo 3.1での生成動画(前回記事同様)
Runway Gen-4.5での生成動画
コンタクトレンズが目に入れた後も手に残っているといった点はありますが、こちらも非常に滑らかで、指示を意図したものになっています。
満員電車から降りてくるスーツ姿のたくさんの魚
元画像(前回記事同様)
プロンプト(前回記事同様)
Many fish in suits getting off a crowded train
日本語訳すると「混雑した電車から降りてくるスーツ姿のたくさんの魚」です。
Veo 3.1での生成動画(前回記事同様)
音声もついています。
Runway Gen-4.5での生成動画
こちらは音なしです。
降りてくる状況の顔についてはかなり繰り返し感が強いですが、全体を見渡しても一匹一匹、一人一人が個別に認識されており、動きの大小はあれどきっちりアニメーションをしております。
最後に
Google Veo 3.1の方が動画の違和感のなさに関してはやや上に思えましたが、Runway Gen-4.5はプロンプトの理解度が売りのようなので、どちらが良いと断言できるほどの大きな差はないと感じます。
各社、天井知らずに性能が上がっており、ツールとしての柔軟性も増しており、触れているだけで楽しくなってしまう。
宣伝
SupershipのQiita Organizationを合わせてご覧いただけますと嬉しいです。他のメンバーの記事も多数あります。
Supershipではプロダクト開発やサービス開発に関わる方を絶賛募集しております。
興味がある方はSupership株式会社 採用サイトよりご確認ください。


