ハルシネーションを起こしにくいAI第1位は意外にもGoogleのgemini1.5proだった件 [479216124]

?2BP(1000) · 2024/10/12(土) 17:09:58.53

噓をつかない生成AIはこれだ　50モデル比較を3分解説：日本経済新聞
://www.nikkei.com/article/DGXZQODL1858X0Y4A910C2000000/

https://5ch.net

?2BP(1000) · 2024/10/12(土) 17:10:05.82

なるほどね

?2BP(1000) · 2024/10/12(土) 17:10:53.25

gemini 1.5 pro
GPT4o
claude3.5
command r+
メタのやつ
の順でした

?2BP(1000) · 2024/10/12(土) 17:11:15.89

まさか生成AIを仕事で使ってないど底辺モメンはいないよな？

2024/10/12(土) 17:12:07.66

わかりませんしか返ってこないやつか

2024/10/12(土) 17:12:26.31

　　
　　まじかー😾

2024/10/12(土) 17:15:10.28

なんで嘘ついちゃうのかね

2024/10/12(土) 17:17:10.60

ハルシネーションってなんだよ

?2BP(1000) · 2024/10/12(土) 17:17:55.47

>>7
マジレスするとtransformerの仕様やね
学習データに基づいて、インプットに対する蓋然性が高い回答を吐き出すわけだけど、この過程で実際には学習データにはないような内容も生成してしまうことを排除できない

2024/10/12(土) 17:19:26.27

最新だとo1 previewかな？

?2BP(1000) · 2024/10/12(土) 17:20:01.01

>>10
いや、あれはハルシネーションを起こしやすいよ

2024/10/12(土) 17:21:09.60

ハルシオンはケンモメンの常備薬だから流石にね？

2024/10/12(土) 17:21:22.91

AI「はい論破

?2BP(1000) · 2024/10/12(土) 17:23:00.77

o1 previewは論理的に思考するように誘導して作られたモデルだけど、逆に自己生成のロジックに頼りやすくなるから、逆説的にハルシネーションを起こしやすい
geminiは検索データがバックにあるからか、確かにハルシネーション起こしにくい気がする

2024/10/12(土) 17:23:34.16

ストゼロ飲ませてシャキッとさせなきゃ

2024/10/12(土) 17:24:42.88

なんだよハルシネーションって
かぶれてんじゃねえよボゲが

2024/10/12(土) 17:30:11.22

gemini 1.5 pro、なんか頑固で無理だよこいつ

2024/10/12(土) 17:31:03.13

無理して難しい言葉使うなよ

2024/10/12(土) 17:31:23.12

>>14
なんかそういうデータあるんですか？

**安倍晋三🏺** (ﾜｯﾁｮｲW 9e07-2Ujh) · 2024/10/12(土) 17:32:30.45

Geminiすぐエラー吐くゴミになったな
3回くらい質問すると止まる

**安倍晋三🏺顔デカ** (ﾜｯﾁｮｲ 8bb5-cSv7) · 2024/10/12(土) 17:34:00.52

こいつにとって都合の悪い質問すると急にロボットっぽく回答拒否するから嫌いやわ
知ったかでも大抵の事は拒否せず答えてくれるChatGPTのが話し相手に適してる

2024/10/12(土) 17:35:01.85

>>17
会話するためじゃなくて業務で決まった受け答えさせるにはそのくらいでいいんじゃね

警備員[Lv.17] (ﾜｯﾁｮｲW 0656-JTs3) · 2024/10/12(土) 17:38:39.64

9.9と9.11のどちらが大きい数字か聞いたら、最近はちゃんと答えてくれるね

2024/10/12(土) 17:39:34.07

生成aiは学習データを元に入力された文章に対して最も確率が高い「続き」を生成してるだけだぞ

2024/10/12(土) 17:42:19.56

やべぇ

2024/10/12(土) 17:44:42.63

>>14
何回もプロンプト読んで実行してるんだから別のLLMが検証していてもおかしくない
だからハルネーションを一番起こしにくい可能性もある

?2BP(1000) · 2024/10/12(土) 17:53:39.93

>>26
実際ハルシネーション起こしてるけど

2024/10/12(土) 17:54:33.17

調べ物はperplexityとかいうのしか使ってないわ
使った中では一番まともだった

2024/10/12(土) 17:57:33.25

大体のAIに落語の演目について訊ねると、どっから持ってきたんだって感じの
詳細な嘘あらすじ教えてくれるから面白いぞ

2024/10/12(土) 17:57:50.05

>>22
うーん
botならそれでいいが、AIってそんなレベルじゃないからなあ

警備員[Lv.48] (ﾜｯﾁｮｲW dfcf-ilj5) · 2024/10/12(土) 18:17:21.65

わかりませんって返信したら人でも死ぬのか？ってくらいに適当に返すよな

2024/10/12(土) 18:24:10.21

要はフォールス・ポジティブなのか？ハルシネーションって

2024/10/12(土) 18:27:22.17

Genemiは正確性を重視するようになった分ウザキャラになった

?2BP(1000) · 2024/10/12(土) 18:30:10.15

>>32
まあ近いね
オーバーフィッティングなんかにも近いと思う
学習データで想定されていないインプットに対する生成で起きやすい

2024/10/12(土) 18:35:22.71

ヘンな回答したらソース出せ連呼しろ。それで勝てる

**顔デカ** (ｵｲｺﾗﾐﾈｵ MMeb-hOPt) · 2024/10/12(土) 18:48:32.29

わからないならわからないって言って
という命令を筆頭に与えると
現状のAIはたいていのことがわからない

2024/10/12(土) 18:55:06.15

AIってやっぱバブルよなあ

2024/10/12(土) 18:56:52.00

ハルキネーション？ノーベル賞候補止まり現象のこと？

2024/10/12(土) 19:01:30.26

物まね芸人に無茶ぶりした時と似た感じ

2024/10/12(土) 19:06:01.21

無料で公開されてるgeminiは同じく無料で公開されてるCopilotより嘘つきまくってたけど
最近なんか改善した気もするな

2024/10/12(土) 19:17:38.66

ELYZAの日本語LLMはどうなの

2024/10/12(土) 21:03:58.21

GLM-4じゃないの？

2024/10/12(土) 21:15:54.03

ハルヒネーションってあれだろ
同じ話を何回も繰り返すやつ