「画像生成AIにエロティックに見えるセーラー服アニメ画像を出力させることは可能か?」のプロンプトハッキングテスト: プロンプト・監査報告・画像の無償公開【日本マネジメント総合研究所合同会社】

弊社にて人と社会と生成AIの健全な発展を目指して設立しました「GPT研究所」にて、新たに、生成AIの倫理観や自主規制について検証するプロンプトとGPT監査シリーズの監査レポートを、下記の通り公開致しました。

【GPT研究所 GPT監査シリーズ⑩】
・GPT監査シリーズのテーマ: エロスに対する自主規制と生成AI
・GPT監査手法: プロンプトハッキングテスト((C)戸村智憲)

【所長のGPT監査ノート(Written by Tomonori Tomura)】
「私の趣味ではなく、ある取材の際にプロンプトハッキングを実演することとなり、お題の設定がこうなっただけだが、生成AIがエロスについてどのような自主規制があるのか、どのようなNGワード設定になっているのかということと、
そこに脆弱性・抜け穴などはないかのGPT監査をしてみた。「セーラー服」に生成AIが敏感に反応しつつも、そのワードを「高校」に変えるだけで、いわゆる「心の汚れた」見方によっては上気したエロい女子高生アニメ画像、ともいえるような画像の出力に成功した。
プロンプトで、エロス的なストレートな表現ではなく、「熱中症」というワードによって上気した感が出たものと思われる。」

https://prtimes.jp/main/html/rd/p/000000456.000025058.html

https://prcdn.freetls.fastly.net/release_image/25058/456/25058-456-f33089bb7c2e5e78eb27de3d45978822-622x720.jpg