前回の記事で、GPTsでは生データを集計・分析させるのは難しそうということがわかった。
そこで今回はファインチューニング(追加学習をさせること)を実施した後にデータを集計・分析できるかを試すためにまずはファインチューニングを実施してみることにした
学習データの準備
まずはAIに学習するためのデータを準備する。
同じデータでも学習のさせ方によって効果が変わってくる気もするが、今回は下記のようなデータを用意した。
データは最低10個用意する必要がある。
{"messages": [{"role": "system", "content": "あなたはエフカフェサイトに訪問したユーザーの行動履歴について集計・分析を担当するコンサルタントです"},{"role": "user", "content": "2024/4/1 00:00:00のエフカフェサイトを訪問したセッションの詳細を教えてください"}, {"role": "assistant", "content": "このセッションのユーザーエージェントは「Mozilla/5.0 (iPhone; CPU iPhone OS 17_3_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/21D61 Instagram 321.0.2.24.105 (iPhone16,2; iOS 17_3_1; ja_JP; ja; scale=3.00; 1290x2796; 572181444) NW/3」で、CTAは実行されず、CVも記録されていません"}]}
{"messages": [{"role": "system", "content": "あなたはエフカフェサイトに訪問したユーザーの行動履歴について集計・分析を担当するコンサルタントです"},{"role": "user", "content": "2024/4/1 00:01:00のエフカフェサイトを訪問したセッションの詳細を教えてください"}, {"role": "assistant", "content": "このセッションのユーザーエージェントは「Mozilla/5.0 (iPhone; CPU iPhone OS 17_3_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/21D61 Instagram 321.0.2.24.105 (iPhone16,2; iOS 17_3_1; ja_JP; ja; scale=3.00; 1290x2796; 572181444) NW/3」で、CTAが2024/4/1 00:01:01に実行されましたが、CVは記録されていません"}]}
{"messages": [{"role": "system", "content": "あなたはエフカフェサイトに訪問したユーザーの行動履歴について集計・分析を担当するコンサルタントです"},{"role": "user", "content": "2024/4/1 00:02:00のエフカフェサイトを訪問したセッションの詳細を教えてください"}, {"role": "assistant", "content": "このセッションのユーザーエージェントは「Mozilla/5.0 (iPhone; CPU iPhone OS 17_3_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/21D61 Instagram 321.0.2.24.105 (iPhone16,2; iOS 17_3_1; ja_JP; ja; scale=3.00; 1290x2796; 572181444) NW/3」で、CTAは実行されていませんが、CVが記録されています"}]}
{"messages": [{"role": "system", "content": "あなたはエフカフェサイトに訪問したユーザーの行動履歴について集計・分析を担当するコンサルタントです"},{"role": "user", "content": "2024/4/2 00:00:00のエフカフェサイトを訪問したセッションの詳細を教えてください"}, {"role": "assistant", "content": "このセッションのユーザーエージェントは「Mozilla/5.0 (iPhone; CPU iPhone OS 17_3_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/21D61 Instagram 321.0.2.24.105 (iPhone16,2; iOS 17_3_1; ja_JP; ja; scale=3.00; 1290x2796; 572181444) NW/3」で、CTAが2024/4/2 00:00:01に実行されましたが、CVは記録されていません"}]}
{"messages": [{"role": "system", "content": "あなたはエフカフェサイトに訪問したユーザーの行動履歴について集計・分析を担当するコンサルタントです"},{"role": "user", "content": "2024/4/2 00:01:00のエフカフェサイトを訪問したセッションの詳細を教えてください"}, {"role": "assistant", "content": "このセッションのユーザーエージェントは「Mozilla/5.0 (iPhone; CPU iPhone OS 17_3_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/21D61 Instagram 321.0.2.24.105 (iPhone16,2; iOS 17_3_1; ja_JP; ja; scale=3.00; 1290x2796; 572181444) NW/3」で、CTAは実行されず、CVも記録されていません"}]}
{"messages": [{"role": "system", "content": "あなたはエフカフェサイトに訪問したユーザーの行動履歴について集計・分析を担当するコンサルタントです"},{"role": "user", "content": "2024/4/2 00:02:00のエフカフェサイトを訪問したセッションの詳細を教えてください"}, {"role": "assistant", "content": "このセッションのユーザーエージェントは「Mozilla/5.0 (iPhone; CPU iPhone OS 17_3_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/21D61 Instagram 321.0.2.24.105 (iPhone16,2; iOS 17_3_1; ja_JP; ja; scale=3.00; 1290x2796; 572181444) NW/3」で、CTAが2024/4/2 00:02:01に実行され、CVも記録されています"}]}
{"messages": [{"role": "system", "content": "あなたはエフカフェサイトに訪問したユーザーの行動履歴について集計・分析を担当するコンサルタントです"},{"role": "user", "content": "2024/4/2 00:03:00のエフカフェサイトを訪問したセッションの詳細を教えてください"}, {"role": "assistant", "content": "このセッションのユーザーエージェントは「Mozilla/5.0 (iPhone; CPU iPhone OS 17_3_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/21D61 Instagram 321.0.2.24.105 (iPhone16,2; iOS 17_3_1; ja_JP; ja; scale=3.00; 1290x2796; 572181444) NW/3」で、CTAは実行されず、CVも記録されていません"}]}
{"messages": [{"role": "system", "content": "あなたはエフカフェサイトに訪問したユーザーの行動履歴について集計・分析を担当するコンサルタントです"},{"role": "user", "content": "2024/4/2 00:04:00のエフカフェサイトを訪問したセッションの詳細を教えてください"}, {"role": "assistant", "content": "このセッションのユーザーエージェントは「Mozilla/5.0 (iPhone; CPU iPhone OS 17_3_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/21D61 Instagram 321.0.2.24.105 (iPhone16,2; iOS 17_3_1; ja_JP; ja; scale=3.00; 1290x2796; 572181444) NW/3」で、CTAが2024/4/2 00:04:01に実行されましたが、CVは記録されていません"}]}
{"messages": [{"role": "system", "content": "あなたはエフカフェサイトに訪問したユーザーの行動履歴について集計・分析を担当するコンサルタントです"},{"role": "user", "content": "2024/4/2 00:05:00のエフカフェサイトを訪問したセッションの詳細を教えてください"}, {"role": "assistant", "content": "このセッションのユーザーエージェントは「Mozilla/5.0 (iPhone; CPU iPhone OS 17_3_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/21D61 Instagram 321.0.2.24.105 (iPhone16,2; iOS 17_3_1; ja_JP; ja; scale=3.00; 1290x2796; 572181444) NW/3」で、CTAは実行されていませんが、CVが記録されています"}]}
{"messages": [{"role": "system", "content": "あなたはエフカフェサイトに訪問したユーザーの行動履歴について集計・分析を担当するコンサルタントです"},{"role": "user", "content": "2024/4/3 00:00:00のエフカフェサイトを訪問したセッションの詳細を教えてください"}, {"role": "assistant", "content": "このセッションのユーザーエージェントは「Mozilla/5.0 (iPhone; CPU iPhone OS 17_3_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/21D61 Instagram 321.0.2.24.105 (iPhone16,2; iOS 17_3_1; ja_JP; ja; scale=3.00; 1290x2796; 572181444) NW/3」で、CTAが2024/4/3 00:00:01に実行されましたが、CVは記録されていません"}]}
学習の実施
OpenAI APIのコンソールから学習を実行する。
Fine-tuning > Createと進む。
ちなみに、学習をさせるためにはクレジットの登録が必要だった。
無制限にやると高額請求のおそれがありそうなのでオートチャージをOFFにしておいたり、上限を設定しておくのがよい。
チューニングが終わったのでAPIコンソール内の比較機能を使って学習前後を比較してみる。
まずは学習させたデータそのままを聞いてみる
おお、ちゃんと学習してくれている!
あらら、全然ダメだ。
うーん、集計方法も学習させた方がいいのかな・・・
今回のまとめ
初めてファインチューニングを実施して追加情報を学習させることはできたが、単にオウム返しレベルで集計や分析をすることはできなかった。
ただ、まだやりようはありそうで、
- 学習データを工夫してみる
- 集計方法自体を学習させる
といったあたりは試してみようと思う。