UiPathコミュニティ最大の年次イベント「UiFes」は、例年10月か11月に開催されますが、その準備は早い段階から始まります。特に、海外のUiPathサイトを活用して情報を集めることが重要です。日本の公式サイトはタイムラグがあり、情報が新鮮ではないため、常に最新情報を把握するために海外サイトをチェックすることにしています。
3月
イベント情報収集とシナリオ作成のための準備
例えば、3月19日に開催された「UiPath AI Summit」の資料や動画は、イベントの方向性を理解し、シナリオのヒントを得るための貴重な資源となります。このようなイベントから得た知識を元に、半年先の「UiFes」に向けたストーリーを構築します。重要なのは、イベント当日にはすでに周知されている情報が多くなるため、情報が色褪せないように、先行してストーリーを作り込んでいくことです。
4月
3DCG素材の選定と購入
ストーリーに合った3DCG素材の選定は、制作における重要な部分です。これまでに購入した素材から適切なものをピックアップし、足りない部分を補うために新たに購入することになります。しかし、定価で購入するのは制作費が高騰してしまうため、セール価格を待ち続ける方法を取ります。セールの更新は3時間おきに行われるため、頻繁にチェックが必要です。
5月
シナリオ修正と制作のアドバイス
シナリオが完成したら、プロのドラマ制作に携わっている友人に添削してもらい、内容の改善点やアドバイスを受けます。この段階でのフィードバックは、最終的な完成度を高めるために不可欠です。
6月
3DCGの実験と技術的挑戦
今回のテーマは「気候変動」です。3DCG制作では、特に雨のシミュレーションや大勢の人が逃げまどうシーンなど、CPUに高い負荷がかかるシーンに挑戦しています。PCの限界を試すためにも、リソースを大量に消費するシーンを重視しています。このような実験を通じて、技術的なチャレンジが浮き彫りになります。
UiPath AI-Powered Automation Summit Tokyoへの参加
6月17日に開催された「UiPath AI-Powered Automation Summit Tokyo」に参加し、UiPathブースでの展示を見学しました。特に、ESGレポートをUiPath製品を使って作成する方法について、新聞記者のように細かく質問をしました。このように、業界の動向をキャッチアップしながら、制作に役立つ情報を得ていきます。
7月
生成AIによる楽曲制作と声優探し
最近、生成AIを使った楽曲制作が容易になったため、実際に試してみたところ、2曲の素晴らしい楽曲が生成されました。これを基に、声優さんに台詞パートの他にヴォーカルの依頼を行いました。1曲目はインストゥルメンタルのみで生成されたものに、初音ミクに歌詞を読ませ、声優さんにメロディを理解してもらうという作業が必要でした。この作業は予想以上に難航し、深夜の時間帯に声優さんとのやり取りが集中することに。最終的に、声優さんの不満がつのり価格交渉が難航、何度も降板の申し出がありましたが、必死の引き留めが続きました。
8月9月
新たな挑戦と技術革新
昨年のクオリティを越えられないという悩みを抱えながらも、新たに有望な動画生成AIが発表され、さらに制作の可能性が広がりました。これを機に、今年の制作では新たな技術を取り入れ、より高品質なコンテンツを目指して挑戦を続けました。
動画生成AIには、テキストから生成する方法と画像から生成する方法の2種類がありますが、前者は生成される動画の予測が困難であり、作品の統一性を欠く可能性が高いです。そのため、今回は画像から生成する方法を選択しました。
画像から動画生成:3DCGとAIの融合
画像から動画を生成する方法では、最初の1コマ目となる画像を自分で作成しなければなりません。このプロセスは、私自身が持っている3DCG制作のノウハウが活かされる部分ですが、イメージ通りの3DCG素材を所有している必要があります。とはいえ、生成AIを使用した場合、予想外の動画が生成されることが多く、10回試して1回成功するかどうかという結果になります。生成AIはプロンプトをいくら細かく書いてもガチャ要素が多く、まさにお金が湯水のように消えていくギャンブルのような側面があります。
私自身、トータルで300回ほど試してみましたが、最終的に作品に反映できた時間は30秒もないかもしれません。観客の中には、すべての動画が生成AIで作られたものだと思った人もいましたが、実際は逆で生成AIが思うような動画を作れなかったため、3DCGに切り替える方が頻繁にありました。
3DCG制作の手間と時間
生成AIであれば、平日のサーバーが混んでいない時間であれば2~3分で動画を作成できるのに対して、3DCGの場合は素材を組み合わせ、アニメーションを作り、台詞に合わせて口の動きをキャプチャーする必要があります。アニメーション制作は、1秒あたり30枚のフレームをレンダリングし、1秒ごとの動きを作り込んでいきます。この作業は、例えば10秒の映像を作るために、PCが10時間以上唸りっぱなし、下手をすると1週間回しっぱなしという状況になります。作業量が多く、時間がかかるため、非常に負荷の高い作業です。
10月
最終的な編集作業とAIによる作曲
最終作業には、Adobe Premiere Proを使用して編集を行いました。レンダリングしたアニメーションに音楽と効果音を付け加えていきます。音楽に関しては、今回は生成AIを利用して作曲したため、ギタリストとの意見の食い違いや口論といった気苦労はありませんでした。この点については非常に効率的で助かりました。
編集作業は複雑な特殊効果を加えることはせず、シンプルに進めたため、1ヶ月で終了し、本番前の配信リハーサルに臨むことができ、大きな指摘もありませんでした。
さて、本番は?イベントメンバーの評価は上々でしたが、一般参加の方の感想が全く分からない状況なので果たして成功だったのか知りたいところです。
結論:生成AIと3DCGの使い分け
今回の制作では、生成AIと3DCGを組み合わせて使うことに挑戦、どちらも一長一短がありました。生成AIの短時間での動画作成のメリットを活かす一方で、3DCGによるクオリティ重視の部分も大切にしなければなりません。どちらの方法にもそれぞれの課題があり、次回の制作ではさらに工夫を凝らしていきたいと考えています。
配信から2週間が経過し英語字幕作成と衝撃の予告映像を追加しています。ナレーションにプロの声優さんを起用させて頂いたお陰でYoutube版は再生数を延ばすことでしょう。