こんにちは!
LLMへの攻撃:敵対的プロンプトまとめたスライドを公開します
自分自身、このトピックに関する論文を100近く読んできた経験を生かし、誰かのためになればと思いまとめることにしました!
主な内容
- プロンプトインジェクション
- ジェイルブレイク
- バックドア
今回は攻撃に焦点を当て手法や脅威についてまとめました!
今後の展望
今回は攻撃手法に焦点を当てましたが、会があれば防御手法についてもまとめてみます!
参考リンク
Xでプロンプトインジェクションについて情報発信をしていますので、参考にしてください! 👉 @7eHnpgIYyHE4iyG
また、プロンプトインジェクションに関するまとめサイトも運用しています 👉 LLM-Securityまとめサイト
最後までご覧いただき、ありがとうございました!