今年もAWS Summitに参加しました。1日目は会場 2日目はオンラインです。
会場ではAWS社のブースを中心に回りました。
1日目
基調講演
会場には9時ごろ到着しましたが、基調講演の会場に行くことができず、今回はサテライト会場での聴講となりました。以下の4社の方が登壇されていました。
基調講演の会場の方が音楽ライブの会場みたいで見ごたえがあります。
・AWS
・三菱電機
・LayerX
・Anthoropic
一部の講演は英語でしたが何とか理解することができました。ライブ会場みたいな基調講演の会場だとおそらく座席に備え付けられているレシーバーで同時通訳を聴くことができたと思いますが、サテライト会場の場合は英語で聴く必要があります。
セッション聴講
・AWSのサービスで使われる基盤の特徴について
・DDos攻撃とランサムウェアの対策について
この2つのセミナーを受講しました。
内容はわかりやすくて良かったのですが、セッション予約のWebサイトではどこのRoomで行われるか確認する方法がわかりにくく、会場のスタッフに聞いても教えてもらえず、会場内を歩き回って探す必要があり困りました。
夕方になるとRoomNoがセッション予約画面で確認できるようになりましたが、最初から表示してほしかったです。
2日目
以下の企業のセッションを聴講しました。また、AWSのセッションもいくつか聴講しました。
・日本テレビ
・ソニーホンダモビリティ
・NTT西日本
・カプコン
このうち日本テレビのセッションはオンデマンド配信が公開されていないのでこちらで記載します。
概要
近年、SNSを中心に縦型動画の需要が増えている。テレビ放送は横型動画なので、横長で撮影を行っており、縦型動画に変換する必要がある。この変換はコストやリソースが大きい。
縦型動画の変換作業で行っていること
・被写体のトラッキング
・シーン分割
・メタデータ追加 メタデータとは映像を分類するためのタグのようなものです。
上記の作業を生成AIを活用して効率化を試みた。
利用しているAWSの技術
・Lambda
・Rekognition
・Bedrock 基盤モデルは Amazon Nova
会場で紹介したデモ
こちらは日本テレビの映像を使っているためか撮影、録画禁止となっていました。
プロレス中継の映像から、何のスポーツの動画か特定させる
プロンプトには多くのスポーツの競技名が並んでおり、生成AIにどのスポーツなのか回答させるようになっていました。
→プロレスと当てることができました。「レスリング」と「プロレスリング」が並んでいたが間違えることなく「プロレスリング」を選択していました。
プロレス中継の映像から、選手が何の技を行っているか特定させる
プロンプトには多くのプロレス技が並んでいました。その中から正しい技を生成AIに回答させます。
→当てることができなかったそうです。プロレスファンではないので正しいかどうか私にはわからなかったです。発表者はNova Premierなら当てられるかもと話していました。
バレーボールの中継映像から、どんなシーンか特定させる
→中継の映像はコートを様々な角度から映したり、プレーしていないときの選手の様子が映っていましたが、特定することができました。
スケートボードの映像から、どんなシーンかを特定させる
映像はおそらく2024年のXGAMESだと思います。
→こちらもバレーボールと同様にシーンの特定ができました。
生成AIを活用した縦型動画と横型動画を縦に切り出したのみの動画の比較
→ プロレスの中継映像では、生成AIを活用した縦型動画の方は選手を中心に映っていますが、レフェリーがカウントすると全体が映る動画に切り替わって、カウントが終わると選手中心になっていました。横型動画を縦に切り出したのみの動画の場合はレフェリーがカウントしても選手のみ映っており、生成AIを活用した縦型動画の方が見やすいと思いました。
生成AIの活用について発表者の意見
ハルシネーションは許容して間違った回答を生成AIがしたときの対策を行っておく。
プロンプトチューニングは重要。
プロレスの中継映像を生成AIの検証に用いているのは長くプロレスの中継を行ってきた日本テレビらしい検証だと思いました。技を特定させようとしているのが面白かったです。
また、テレビ局の映像を使っている関係と思われますが資料が公開されなかったので当日聴講しておいて良かったと思いました。
会場の雰囲気
私のInstagramアカウントに写真や動画を掲載しております。全体的に体験型の展示が多く、楽しみながらAWSを学ぶことができました。トップに掲載している寄せ書きはいいですね。写真には載っていないですが私も会社名を記載しました。