3
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

GlobeeAdvent Calendar 2023

Day 10

ChatGPTを用いた映画字幕への語注作成

Last updated at Posted at 2023-12-13

はじめに

こんにちは、GlobeeでCTOをやっています上赤です。
Globee Advent Calendar10日目の記事です。

弊社では様々な業務領域でChatGPTを活用していますが、今回は映画字幕への語注作成サポートに活用した際の記録を残します。

前提

弊社が作っているサービスabceedでは、映画を使った英語学習を行うことが出来ます。どんな学習ができるのかに興味がある方は、こちらの記事に詳細ありますので、是非御覧ください。

さて、映画を英語教材として活用するためには、映画のフレーズごとの秒数調整/語注解説作成/直訳作成など、様々な作業が必要です。

そのような作業は弊社オリジナルコンテンツチームが行っているのですが、正直かなり負荷が大きい作業です。作業を進めていく中で、ChatGPTを使ってオリジナルコンテンツチームの負荷が減らせないものか?と考え、挑戦してみることにしました。

なお、弊社オリジナルコンテンツチームの構成/業務内容については、こちらの記事にまとまっていますので、もし興味がある方は合わせてご覧ください。ネイティブと日本人が協力して質の高いコンテンツを作り上げる、非常に面白いチームです。

やりたいこと

映画コンテンツをより学習しやすくするために、映画内の各フレーズに対して1つ1つ語注を付ける必要があります。
1700401325215-U2CLBK2V5N (3).jpeg

当初はそれを一つ一つゼロから作っていたのですが、ChatGPTによって各フレーズの語注の候補を提案し、それを人の手で修正及び追記する方針にすれば作業速度を上げることが出来るのでは?という発想に至りました。

やったこと

最初は、以下のような単純なプロンプトを使って各フレーズの語注を生成していたのですが、オリジナルコンテンツチームから

  • 簡単すぎる単語が語注に含まれており、削除する手間がかかる
  • フォーマットが統一されていない
  • 語注の内容が間違っていることが多い
    などの問題で、作業がそこまで効率化されないというFBがありました。

当初使っていたプロンプト例

こちらは、ある映画・ドラマ{filmname}のセリフです。

例に従って、質問のセリフの中に、単語と文法を3〜7個までできるだけ多く選んで、例と同じフォーマットで語注を作成してください。

例:
セリフ:a band of brave heroes brought us back.
答え:
■ a band of 【限定】〜の集団、〜たち
■ bring back 【動】〜を連れ戻す

問:
セリフ:{dialog}
答え:

最終的な処理フロー

その後、様々な試行錯誤を経て、以下のようなフローに落ち着きました。

Untitled (1).png

このフローを全て説明すると長くなりすぎてしまうので、かなり簡略化して説明します。

まず、

  • 映画のフレーズに対して完全に自由に語注を生成させるプロンプト1
  • 過去に採用した語注のデータベースを元に、対象単語を指定して語注を生成させるプロンプト2
    を用意します。

2つのプロンプトによって作成された語注をマージし、更にそれに対して、該当単語で過去に採用した語注のリストを加え、語注の候補リストを作成します。

次に、作成した語注の候補リストを、

  • フレーズと語注の候補リストを元に、そのフレーズにおいて最も適切であると思う語注を選択するプロンプト3
    に与え、語注の最終候補を取得します。

プロンプト3の例

以下の英語単語あるいは文法の説明のうち、一番文脈に合っているのはどちらですか?

例:
文章:You must release that handle!
説明:
A【動】:〜に対処する	
B【動】:〜を扱う	
C【句動】:〜を扱う、〜に対処する	
D【動】:〜を対処する	
E【動】:〜に対応する、〜に対処する	
F【動】:(問題など) に対処する	
G【名】:ハンドル 

答え:G

問題:
文章:{phrase}
説明:
{option}

答え:_(選択肢のみ)

最後に、取得した語注の最終候補に対し、手動のロジックでフォーマットの調整及び簡単すぎる単語の除外を行い、最終結果とします。

このフローによって、当初課題だった以下の点は大きく改善され、オリジナルコンテンツチームの作業時間削減に貢献することが出来ました!

  • 簡単すぎる単語が語注に含まれており、削除する手間がかかる
  • フォーマットが統一されていない
  • 語注の内容が間違っていることが多い

まとめ

当初の想定よりもかなり複雑なフローになってしまいましたが、複数のプロンプトとロジックを組み合わせたフローにすることで、単発プロンプトよりもかなり高い効果を得ることが出来ました。
今後も様々な領域でChatGPTを活用し、業務改善をしていけたらと思います。

弊社では、現在アプリ/Web/サーバーエンジニア/PjMなど、ほぼすべての開発ポジションを募集中です!
ちょっとでも興味持った人は以下からカジュアル面談をご検討ください。色々お話します!
採用ページ

3
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?