生成AIにAA(アスキーアート)を入力すると有害コンテンツを出力すり [377482965]

■ このスレッドは過去ログ倉庫に格納されています
0001🍜🍚 (ワッチョイW 0f21-PrTh)2024/03/07(木) 09:29:56.87ID:CTHGEO9m0?2BP(2223)

生成AIに“アスキーアート”入りプロンプト入力→有害コンテンツ出力 米研究者らが新手の脱獄法発見(ITmedia NEWS)
https://news.yahoo.co.jp/articles/503167b1d64ab1839b8f3fb4839bf75979168b47

0002安倍晋三🏺 ◆ABeSHInzoo (ワッチョイW 3bfc-UGZs)2024/03/07(木) 09:31:08.81ID:Y5irOkE80
   ░▒░▒▓   
     ▓ん░▒
    /    ヽ
     | | ・  ・.||  
     | |  .,;, .||
     {ii █░▒ 
      █▓▓▒

0003安倍晋三🏺 ◆AbeShinzoG2A (JPW 0H3f-XXsC)2024/03/07(木) 09:33:14.56ID:SaqlHa2KH
(ヽ´ん`)悟リ

0004番組の途中ですがアフィサイトへの転載は禁止です (ベーイモ MM7f-BO7a)2024/03/07(木) 09:44:12.87ID:aYlEMgueM
>大規模言語モデル(LLM)がアスキーアートを正しく認識できないという脆弱性を
いや、正しく認識してるからこうなるんだろ

0005安倍晋三🏺 ◆abeshinzo. (ワッチョイW 9fc6-nxCC)2024/03/07(木) 09:46:46.22ID:y+fnJwmF0
これ記事の文章あってる?
記事の画像ではAlignmentが認識できないけどLLMは認識できるので脱獄できてるように思えるが

0006安倍晋三🏺 (ワッチョイW 6b5e-kcGR)2024/03/07(木) 09:46:50.89ID:sEAYIy+l0
すりますか

■ このスレッドは過去ログ倉庫に格納されています