はじめに
こちらはデータラーニングギルド Advent Calendar 2024 2日目の記事になります。
今回は今年、ギルドで取り組んだ生成AIやデータ分析に関する研修資料の作成秘話として、生成AI(ChatGPT)をフル活用し、クオリティを保ちながら爆速で研修資料を作った話を紹介したいと思います。
社内で何かと資料作成をすることが多い方の参考になれば幸いです。
時間がないけれど、クオリティは落としたくない
これまでもChatGPTを仕事で使うことは多々ありましたが、今回はいくつかの制約条件があり、これまでよりもかなりChatGPTをガッツリ使う必要がありました。
具体的には、
- 資料の作成期限は2か月
- 普通だったら数ヶ月かけてじっくり作るようなボリュームの大量の研修資料を作る
- 動画教材なので読み上げ原稿も必要
- 専門教材としてのクオリティは落とさない
1.〜3.の量と時間的な制約を満たしたうえで、生成AIやデータ分析の研修資料としてのクオリティは落とさないためには、これまで以上にChatGPTと自分のデータサイエンティストとしての視点を融合させながら効率的に資料作成を進めて行く必要がありました。
最終的に70時間で、160枚以上のスライド資料と読み上げ原稿を作り上げたプロセスを以下で紹介していきます。
先に述べておくと、プロンプトの紹介はあまりしません。
なぜなら、使うべきプロンプトは業務によって大きく変わって来るため、紹介したとしても汎用性がないためです。
一方で、スライド作成のどのようなプロセスで生成AIを活用することで、クオリティを保ちながら爆速で作業を進めていたのかについては、汎用性があるため、こちらに重心をおいて説明していきたいと思います。
今回使用している生成AI
- ChatGPT Plus(Personal)
研修資料作成のプロセス
以下のようなプロセスで資料作成を行いました。
- 大枠の章立てを作る
- 各章を分割し、アウトラインを作成する
- アウトラインに基づいて、文字だけ入れたスライドを作成する
- 流れがOKなら作図する
- 各スライドに読み上げ原稿を作成する
実際にはこのあとに読み上げ音声や動画作成が入りましたが、私が関与したところまでに絞って今回は紹介していきたいと思います。
ChatGPTを活用したポイント
4.の作図以外のすべての工程でChatGPTを使いました。
作図も使えるんじゃ?と思うかもしれませんが、研修の目的意図を踏まえたシンプルかつ資料全体として一貫性のあるテイストのイラストや図を作る必要がありましたので、生成AIで作るよりは適するものを作成したほうが良いという判断でした。
イラストはテイストを揃えるために以下のイラスト素材を使用しました。
とても使いやすかったです(感謝の気持ちを込めてコーヒーを寄付しました)。
以下では特に効果が高かったChatGPTの使い方を解説していきます。
アウトラインを作る(体感作業圧縮率:40~60%)
データサイエンスや生成AIについてある程度慣れ親しんでいる私にとって当たり前のことでも、研修の対象者にとっては馴染のないことというのは多々あります。
アウトライン作成にあたっては、私が研修目的と照らし合わせる必要があると思うキーワードはChatGPTに与えつつ、以下のような前提を考慮するように指示し、アウトラインの精度を向上させました。
- 当該分野の背景知識を持っていない標準的なビジネスマン向けの内容にすること
- 必要な知識がある場合は都度説明をいれること
- 複雑な情報は分解し、1スライド1メッセージになるように分けること
ポイントは最終的なスライドのイメージをChatGPT利用者が持っているということです。
どんな構成にしたいのかの大枠のイメージは持っておきながら、細部をChatGPTに埋めてもらって修正していく、という流れで作業を進めていきました。
事例を調査する(体感作業圧縮率:50~80%)
研修を作る際、受講生は基本的にこれから説明しようとしていることに対して知識がないことを前提に説明を組み立てて行く必要があります。
そのとき、具体をイメージできる事例紹介は欠かせません。
私は基本的にリサーチが面倒で面倒で仕方ない質なのですが、ChatGPTのブラウジング機能を使ってキーワードから事例収集をしてきました。
例えば、生成AIやデータ活用に関する事例で言えば世の中に星の数ほどありますが、その中からターゲットユーザーにとってわかりやすく、かつ研修の内容にマッチする事例を探すのは一苦労です。
ChatGPTのブラウジング機能を使うことで、複数の条件にマッチする事例をかなり簡単にリストアップすることができました。
これによって事例調査時間をかなり圧縮できました。
調査結果で得られたレポートを更に事例として使いやすく加工して使用
ダミーデータを作る(体感作業圧縮率:80~90%)
データ分析の研修では、ほぼ必ずといっていいほどデータを見せて説明をする必要があります。
例えば、相関に関する説明や可視化結果から示唆を導くなど。
そんなときにちょうどいいデータが手元になかったりして、データを探してくるなり、意図に合うデータを作る必要が出てきます。
今回はデータのばらつきやバリエーションなど、研修で扱う上で満たしたい条件をChatGPTに指示してダミーデータを複数作成しました。
アウトラインのところでもコメントしたように、どんな物が必要なのかは資料作成者自身が明確に思想を持っておく必要があります。
逆に言えば、それがあればChatGPTからの回答精度も上がりますし、回答を見てすぐに取捨選択をすることができます。
研修としてのクオリティを保つために必要なものは、そういった全体感とその言語化なのだと考えています。
バイアスを説明するためのダミーデータの作成時のやり取り
各スライドのボディメッセージを作成する・推敲する(体感作業圧縮率:50~70%)
ここは全体の中でクオリティ担保のためにかなり時間をかけました。
ChatGPTにいくら背景情報や章立てをしっかり入れても説明が冗長だったり、あまりにも一般的な内容が出力される場合も多かったので、メッセージの叩き案を作ってもらって半分くらい修正をしてFixするような流れで作業していきました。
アウトラインを元にボディメッセージの叩き案を作成
スライドの内容を元に読み上げ原稿を作成する(体感作業圧縮率:90%以上)
今回の資料作成全体を通じて、一番作業が圧縮されたと感じたのが読み上げ原稿の作成でした。
読み上げ原稿の作成では、これまでに作成したパワーポイントファイルを読み込み、そのボディメッセージの内容を元に読み上げ原稿のドラフトを作成してもらいました。
この際、いくつかの観点を考慮するように指示しました。
- 原稿がボディメッセージをほぼ読むだけになりがちだったので、適宜、例示やメリットデメリットの説明など、ボディメッセージを補足する情報を加えるように指示
- 説明が簡潔になりすぎて、研修の予定時間よりもだいぶ短い読み上げ原稿になってしまったので、最低文字数を指定
- 次ページの内容を考慮して、次のページへのつなぎの言葉を適宜、加えるように指示
- 初学者が理解しやすいような言葉遣いで
- 書き言葉ではなく話し言葉で etc.
パワーポイントファイルと指示を加えたらあとはどんどん原稿作成
上記に加え、実際に出てきた原稿を筆者の方で修正して最終化した原稿をChatGPTに与え、出力の改善も図っていきました。
最終的に原稿量は4万字程度になりましたが、ChatGPTをフル活用することで、クオリティコントロール以外のかなりの作業時間を圧縮することができました。
めでたしめでたし。
おわりに:昔には戻れない
ここまでお読みいただきありがとうございました。
今回短期間集中で研修資料を作り上げていって思ったことは、この作業を生成AIなしで今後やることはありえないということでした。
とても多くの時間をかければ出来上がることはわかっても、人間の頭で考えるよりも遥かに効率よくドラフトを作れる生成AIの存在を実感したら、もはやそれ以降の世界で同じことをやろうとは思えなかったのです。
個人的にはこういった生成AI体験をする人がどんどん増えて行けば社会はどんどん前に進み、不可逆的に、昔には戻れなくなって行くと考えています。
去年より今年が、今年より来年がよりPowered by 生成AIになっていくでしょう。
以上