fuipp
@fuipp

Are you sure you want to delete the question?

If your question is resolved, you may close it.

Leaving a resolved question undeleted may help others!

We hope you find it useful!

自然言語処理のためのデータセットのオーバーサンプリング方法について

解決したいこと

感情分析や含意関係認識などのデータセットのオーバーサンプリングはchat gptなどの生成AIを使うのが一般的でしょうか?その他有用な手法があれば教えていただきたいです。
特定の状況に特化したデータセットを作りたいと考えています。

0

1Answer

状況を正確に把握できないのですが、考えられるオーバーサンプリングが二つあります。

  • データ拡張
  • 生成モデルの活用
    • 知識蒸留
    • データ補強

データ拡張のサーベイ論文:Data Augmentation Approaches in Natural Language Processing: A Survey

結局は、学習の目的次第ですが、おそらくはこれらのどれかを行えば良いかと思います。

プロジェクトが成功することを願っております。

0Like

Your answer might help someone💌