自然言語処理のためのデータセットのオーバーサンプリング方法について
解決したいこと
感情分析や含意関係認識などのデータセットのオーバーサンプリングはchat gptなどの生成AIを使うのが一般的でしょうか?その他有用な手法があれば教えていただきたいです。
特定の状況に特化したデータセットを作りたいと考えています。
0
感情分析や含意関係認識などのデータセットのオーバーサンプリングはchat gptなどの生成AIを使うのが一般的でしょうか?その他有用な手法があれば教えていただきたいです。
特定の状況に特化したデータセットを作りたいと考えています。
状況を正確に把握できないのですが、考えられるオーバーサンプリングが二つあります。
データ拡張のサーベイ論文:Data Augmentation Approaches in Natural Language Processing: A Survey
結局は、学習の目的次第ですが、おそらくはこれらのどれかを行えば良いかと思います。
プロジェクトが成功することを願っております。