X

ハルシネーションを起こしにくいAI第1位は意外にもGoogleのgemini1.5proだった件 [479216124]

■ このスレッドは過去ログ倉庫に格納されています
1顔デカだって空も飛べるはず 警備員[Lv.4][新芽] (ワッチョイW cbaf-e4TD)
垢版 |
2024/10/12(土) 17:09:58.53ID:nWHPqPRz0?2BP(1000)

噓をつかない生成AIはこれだ 50モデル比較を3分解説:日本経済新聞
://www.nikkei.com/article/DGXZQODL1858X0Y4A910C2000000/

https://5ch.net
2顔デカだって空も飛べるはず 警備員[Lv.4][新芽] (ワッチョイW cbaf-e4TD)
垢版 |
2024/10/12(土) 17:10:05.82ID:nWHPqPRz0?2BP(1000)

なるほどね
3顔デカだって空も飛べるはず 警備員[Lv.4][新芽] (ワッチョイW cbaf-e4TD)
垢版 |
2024/10/12(土) 17:10:53.25ID:nWHPqPRz0?2BP(1000)

gemini 1.5 pro
GPT4o
claude3.5
command r+
メタのやつ
の順でした
4顔デカだって空も飛べるはず 警備員[Lv.4][新芽] (ワッチョイW cbaf-e4TD)
垢版 |
2024/10/12(土) 17:11:15.89ID:nWHPqPRz0?2BP(1000)

まさか生成AIを仕事で使ってないど底辺モメンはいないよな?
5番組の途中ですがアフィサイトへの転載は禁止です (JP 0H86-c29V)
垢版 |
2024/10/12(土) 17:12:07.66ID:zOBvYDgTH
わかりませんしか返ってこないやつか
2024/10/12(土) 17:12:26.31ID:DL+AQteuM
  
  まじかー😾
2024/10/12(土) 17:15:10.28ID:Tx6jejzH0
なんで嘘ついちゃうのかね
8番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW ca51-PziQ)
垢版 |
2024/10/12(土) 17:17:10.60ID:uZtc4A5T0
ハルシネーションってなんだよ
9顔デカだって空も飛べるはず 警備員[Lv.4][新芽] (ワッチョイW cbaf-e4TD)
垢版 |
2024/10/12(土) 17:17:55.47ID:nWHPqPRz0?2BP(1000)

>>7
マジレスするとtransformerの仕様やね
学習データに基づいて、インプットに対する蓋然性が高い回答を吐き出すわけだけど、この過程で実際には学習データにはないような内容も生成してしまうことを排除できない
2024/10/12(土) 17:19:26.27ID:T8RUQh2D0
最新だとo1 previewかな?
11顔デカだって空も飛べるはず 警備員[Lv.4][新芽] (ワッチョイW cbaf-e4TD)
垢版 |
2024/10/12(土) 17:20:01.01ID:nWHPqPRz0?2BP(1000)

>>10
いや、あれはハルシネーションを起こしやすいよ
2024/10/12(土) 17:21:09.60ID:aUbDD3Yb0
ハルシオンはケンモメンの常備薬だから流石にね?
13番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 06d3-oLgd)
垢版 |
2024/10/12(土) 17:21:22.91ID:UnFFQSQ70
AI「はい論破
14顔デカだって空も飛べるはず 警備員[Lv.4][新芽] (ワッチョイW cbaf-e4TD)
垢版 |
2024/10/12(土) 17:23:00.77ID:nWHPqPRz0?2BP(1000)

o1 previewは論理的に思考するように誘導して作られたモデルだけど、逆に自己生成のロジックに頼りやすくなるから、逆説的にハルシネーションを起こしやすい
geminiは検索データがバックにあるからか、確かにハルシネーション起こしにくい気がする
2024/10/12(土) 17:23:34.16ID:PKdSVn6BM
ストゼロ飲ませてシャキッとさせなきゃ
2024/10/12(土) 17:24:42.88ID:OMVjM3EY0
なんだよハルシネーションって
かぶれてんじゃねえよボゲが
17番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ d336-cSv7)
垢版 |
2024/10/12(土) 17:30:11.22ID:k/Q33pfv0
gemini 1.5 pro、なんか頑固で無理だよこいつ
18番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ df18-oLgd)
垢版 |
2024/10/12(土) 17:31:03.13ID:gnviuPSB0
無理して難しい言葉使うなよ
19番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 3371-PziQ)
垢版 |
2024/10/12(土) 17:31:23.12ID:GqOQFToi0
>>14
なんかそういうデータあるんですか?
20安倍晋三🏺 (ワッチョイW 9e07-2Ujh)
垢版 |
2024/10/12(土) 17:32:30.45ID:3J5nZOwu0
Geminiすぐエラー吐くゴミになったな
3回くらい質問すると止まる
21安倍晋三🏺顔デカ (ワッチョイ 8bb5-cSv7)
垢版 |
2024/10/12(土) 17:34:00.52ID:FbASCpeD0
こいつにとって都合の悪い質問すると急にロボットっぽく回答拒否するから嫌いやわ
知ったかでも大抵の事は拒否せず答えてくれるChatGPTのが話し相手に適してる
22番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 4e03-SWST)
垢版 |
2024/10/12(土) 17:35:01.85ID:d/9bUCLo0
>>17
会話するためじゃなくて業務で決まった受け答えさせるにはそのくらいでいいんじゃね
2024/10/12(土) 17:38:39.64ID:Kjbtcb+h0
9.9と9.11のどちらが大きい数字か聞いたら、最近はちゃんと答えてくれるね
24番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 43fd-47G5)
垢版 |
2024/10/12(土) 17:39:34.07ID:kjAz/AwA0
生成aiは学習データを元に入力された文章に対して最も確率が高い「続き」を生成してるだけだぞ
2024/10/12(土) 17:42:19.56ID:bA04rmLo0
やべぇ
26番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 9b43-cZk2)
垢版 |
2024/10/12(土) 17:44:42.63ID:MpqboNjV0
>>14
何回もプロンプト読んで実行してるんだから別のLLMが検証していてもおかしくない
だからハルネーションを一番起こしにくい可能性もある
27顔デカだって空も飛べるはず 警備員[Lv.5][新芽] (ワッチョイW 3388-e4TD)
垢版 |
2024/10/12(土) 17:53:39.93ID:D4bsnUBB0?2BP(1000)

>>26
実際ハルシネーション起こしてるけど
2024/10/12(土) 17:54:33.17ID:UD3caaLs0
調べ物はperplexityとかいうのしか使ってないわ
使った中では一番まともだった
2024/10/12(土) 17:57:33.25ID:j36bFTpw0
大体のAIに落語の演目について訊ねると、どっから持ってきたんだって感じの
詳細な嘘あらすじ教えてくれるから面白いぞ
30番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ d336-cSv7)
垢版 |
2024/10/12(土) 17:57:50.05ID:k/Q33pfv0
>>22
うーん
botならそれでいいが、AIってそんなレベルじゃないからなあ
2024/10/12(土) 18:17:21.65ID:BFoMHa3i0
わかりませんって返信したら人でも死ぬのか?ってくらいに適当に返すよな
32番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 4a0c-6oN7)
垢版 |
2024/10/12(土) 18:24:10.21ID:s37EoYt/0
要はフォールス・ポジティブなのか?ハルシネーションって
33番組の途中ですがアフィサイトへの転載は禁止です (JPW 0H86-XjSR)
垢版 |
2024/10/12(土) 18:27:22.17ID:XhkL6m4GH
Genemiは正確性を重視するようになった分ウザキャラになった
34顔デカだって空も飛べるはず 警備員[Lv.5][新芽] (ワッチョイW 3388-e4TD)
垢版 |
2024/10/12(土) 18:30:10.15ID:D4bsnUBB0?2BP(1000)

>>32
まあ近いね
オーバーフィッティングなんかにも近いと思う
学習データで想定されていないインプットに対する生成で起きやすい
2024/10/12(土) 18:35:22.71ID:wlEOaobZ0
ヘンな回答したらソース出せ連呼しろ。それで勝てる
2024/10/12(土) 18:48:32.29ID:OHxP0q6tM
わからないならわからないって言って
という命令を筆頭に与えると
現状のAIはたいていのことがわからない
37番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 4aea-jyON)
垢版 |
2024/10/12(土) 18:55:06.15ID:/u7LKUG10
AIってやっぱバブルよなあ
2024/10/12(土) 18:56:52.00ID:4lU59vp40
ハルキネーション?ノーベル賞候補止まり現象のこと?
39番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 2a08-U3qR)
垢版 |
2024/10/12(土) 19:01:30.26ID:GjTwdC0m0
物まね芸人に無茶ぶりした時と似た感じ
2024/10/12(土) 19:06:01.21ID:ktQb3dAa0
無料で公開されてるgeminiは同じく無料で公開されてるCopilotより嘘つきまくってたけど
最近なんか改善した気もするな
2024/10/12(土) 19:17:38.66ID:7+eQA3MB0
ELYZAの日本語LLMはどうなの
42番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW e7d6-wKap)
垢版 |
2024/10/12(土) 21:03:58.21ID:JUQA0AiB0
GLM-4じゃないの?
2024/10/12(土) 21:15:54.03ID:8EDSJFho0
ハルヒネーションってあれだろ
同じ話を何回も繰り返すやつ
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況