この記事には「メタルギアソリッド」に関する重大な ネタバレ が含まれています。
ネタバレを回避したい方はブラウザバックしてください。
1.はじめに
「メタルギアソリッドで学ぶWhisper+ChatGPT」その3です。
その1もしくはその2はこちら
1-1.前回までの作業
- OpenAIのPythonライブラリWhisperを用いて、モデルごとに文字起こしファイル(txt)を作成しました(その1)
- 各モデルごとに比較・評価を行いました(その2)
1-2.この記事で行うこと
- 文字起こしファイルをChatGPTに読み込ませ、概要を出力します
2.分析に使用するファイル
前回文字起こしした中で一番精度の良かったlargeを使用します。
3.ChatGPTによる分析
3-1.要約の出力
かなり正確に要約できています。
また、このセリフの掛け合いがメタルギアソリッドの終盤の重要なシーンであることも分かるようです。
3-2.台本の出力(話者を追加)
文脈から、誰が話しているかを分析できているようです。
会議などで喋っている人ごとに分けることなどもできそうです。
3-3.PowerPoint形式で出力してみる
明らかに指示不足で、何が出るか想像もつきませんでしたが、確かに何が何だかよくわからないパワポ資料が完成しました。内容も少しずれてきているような…?
会議などでパワポにするときは、もう少し状況を説明したり、作りたい形をある程度指示しないといけませんね。
4.終わりに
結局、Whisperを試してみたかった1/3、2/3がピークで、この記事はオマケのような内容になりました…笑
なかなか実在の会議を題材として記事を書くのは難しいですが、Whisperによる文字起こしからChatGPTによる概要のとりまとめまでは十分に使用に耐えうるレベルですね!