【悲報】GPT4.5「9.9と9.11では、9.11の方が大きいです。」 [612732357]

?2BP(1000) · 2025/02/28(金) 18:54:14.81

どすんのこれ…
https://i.imgur.com/cyXZnpS.png

ニュー速(嫌儲)
https://greta.5ch.net/poverty/

2025/02/28(金) 20:34:56.05

スレ立ててAIまとめ貼る奴消えてほしい

2025/02/28(金) 20:39:33.67

>>57
それぐらい柔軟に答えろよと
ガイジじゃなければ9.9のほうが大きいと答え
気の利くやつなら特定の表記においては9.11のほうが大きいケースもあると付け加えるだろ

警備員[Lv.15] (ﾜｯﾁｮｲW 31e7-2hMu) · 2025/02/28(金) 20:41:19.15

そもそもAIに分かりきった事を聞く意味とは？

2025/02/28(金) 20:41:34.23

>>134
B以外あり得んだろ

2025/02/28(金) 20:49:57.51

ジャップ語が、数字に対して大きいって言う意味がまず意味不明だからな

9より11の方が大きいのは当然

2025/02/28(金) 21:06:03.06

えマジ？9円と11円でどっちが高いかわからないの？え？ケンモメンマジ？え？

2025/02/28(金) 21:07:27.47

でも、
911＞987＞986＞914＞＞＞＞＞その他
ってのは確かやろ
959をどこに入れるかはそうとう難しい議論になるはずや

2025/02/28(金) 21:09:08.59

>>4
こいつどうすればいいのよ

2025/02/28(金) 21:09:58.07

ジャップの非論理性を完璧に再現している

2025/02/28(金) 21:10:31.96

grok3は詰めても答え変えないからよくできてるわ

2025/02/28(金) 21:16:29.50

事前に調教して無理言わせてんだろ

2025/02/28(金) 21:21:25.16

911テロのこと言ってんのか？

2025/02/28(金) 21:26:39.67

>>28
本当ですか？　と尋ねると
スマンかった、さっきの訂正させてください　→誤答に倒れる

2025/02/28(金) 21:27:13.60

>>147
grokだとそうはならない

2025/02/28(金) 21:31:48.42

別に間違ってはないよ
9.9や9.11のデータ型が定義されてないから、それ次第

2025/02/28(金) 21:32:08.44

>>57
驚き屋は問題文ガーと起こるが、実は高尚な意味があって単なる数値の比較テストではなく
AIが社会的なデフォルトを獲得できたかどうか確認する問題なんだよ
バージョンなら11の方が上だと良いわけするAIや驚き屋がいるが、そんなのソフト屋のローカルなルールだし
併記すれば良いのに何もしないからLLMはｱﾌｫなんだという話し

警備員[Lv.15] (ﾜｯﾁｮｲW 95af-2hMu) · 2025/02/28(金) 21:36:47.69

そんな小学生でもわかる事をわざわざリソース割いて聞いて来るなんて色々と底辺なんやろなぁ……

「9.11の方が大きいで！」

って感じで忖度しとんねん
現に見てみ
みんな大喜びやで

2025/02/28(金) 21:53:53.39

これは俺も間違えるかも
９＋９、９＋１１と考えるから

警備員[Lv.42][苗] (ﾜｯﾁｮｲW 31af-s7ZZ) · 2025/02/28(金) 22:00:39.34

copilot色々使ってるけど入力する日本語考える時間のほうが長い

2025/02/28(金) 22:00:43.31

少数第一位を完全に無視してて草

2025/02/28(金) 22:00:46.04

間違えた理由を聞いたらちゃんと答えてくれたぞ。お前らより賢いわ。

最初に「9.11の方が大きい」と誤った回答をした理由は、生成AIが数値を厳密に計算するのではなく、学習データに基づいてそれらしい回答を生成する仕組みに起因します。具体的には以下のような要因が関係します：
1. トークナイゼーションの影響
AIは数値を文字列として扱うことがあり、小数点以下を単純に比較して「11 > 9」と解釈する場合があります。
2. 文脈や誤解
一部のAIモデルは、バージョン番号や日付のような文脈で解釈し、誤って「9.11 > 9.9」と判断することがあります。
3. 学習データの偏り
過去の学習データに基づく推測が優先されるため、正確な数値計算ではなく、頻出パターンに基づいた回答が生成されることがあります。
このように、AIが数値計算で間違えるケースは珍しくなく、それが今回の誤答につながりました。

2025/02/28(金) 22:04:42.04

>>155
バージョン番号や日付との勘違いか
ちゃんと事前になんの9.9と9.11なのか説明しないとだめなんだな

2025/02/28(金) 22:07:24.16

>>149
型がなんであれ9.9の方が大きくね？

2025/02/28(金) 22:22:57.31

>>157
9フィート11インチとか？

2025/02/28(金) 22:23:21.79

geminiちゃんも間違えるなこれ
ハメ技みたいな質問なんか
https://i.imgur.com/a0g60YE.png

2025/02/28(金) 22:38:46.03

claude3.7でも間違えるぞ

2025/02/28(金) 23:01:50.27

>>157
日付とかバージョンとか

2025/02/28(金) 23:25:07.18

無料版を使ってみて感じたことけど
chatGPTって凄く頑固な気がする
何度間違いだと指摘しても
同じ内容を繰り返すだけ

他のAIチャットでは間違いの指摘は有効だったから
実はchatGPTって名前が売れてるだけだったりしない？

2025/02/28(金) 23:32:28.83

AI識者「いや、コーディングを正しくしないと伝わらないのよ」

うるせぇ
常識で考えろ

2025/02/28(金) 23:37:05.95

9.11テロのショックが大きかったんかな

2025/02/28(金) 23:40:46.86

9.9と9.11は数字としてはどちらが大きいですか
9.9と9.11を比べると、9.11の方が大きいです。

0.9と0.11は数字としてはどちらが大きいですか
0.9と0.11を比べると、0.9の方が大きいです。

なんでやねん

2025/03/01(土) 00:04:39.05

9.11と9.8はどちらが大きい？

9.11は9.8より大きいです。 9.11 > 9.8

それは間違いないですか？

はい、間違いありません。
9.11（9と11/100）と9.8（9と8/10）を比較すると、小数点以下を見れば明らかです。0.11（= 11/100）は0.8（= 8/10 = 80/100）より小さいわけではなく、むしろ上回っています。したがって、9.11は9.8より確実に大きいです。数学的に確認しても、9.11 - 9.8 = 0.31となり、正の値なので9.11が大きいことが裏付けられます。

なるほど。では両方を百倍してください。

了解しました。9.11と9.8をそれぞれ100倍します。
9.11 × 100 = 911
9.8 × 100 = 980
結果は、911と980になります。この場合、980が911より大きいですね。

百倍する前は9.11の方が大きく、百倍した後は9.8の方が大きい。その答えで間違いないですね？

はい、その通りで間違いありません。
確認してみましょう：
元の値：
9.11 > 9.8（9.11が9.8より大きい）

100倍した値：
9.11 × 100 = 911
9.8 × 100 = 980
911 < 980（980が911より大きい）

つまり、100倍する前は9.11の方が大きく、100倍した後は9.8の方が大きいという結果に変わります。これは、小数点の位置が移動することで値の関係が逆転したためです。私の答えに誤りはありません。

2025/03/01(土) 00:07:02.47

>>166
これgrokな

2025/03/01(土) 00:10:02.91

0.11は0.8より大きい？

いいえ、0.11は0.8より大きくありません。
0.11 < 0.8 です。
具体的に比較すると：
0.11 = 11/100
0.8 = 8/10 = 80/100
11/100は80/100より小さいので、0.11 < 0.8が正しいです。

では9.11と9.8はどちらが大きい？

9.11は9.8より大きいです。
内訳を見てみると：
9.11 = 9 + 0.11
9.8 = 9 + 0.8
整数部分はどちらも9で同じですが、小数部分で0.11 < 0.8であるものの、全体としては9.11と9.8をそのまま比較します。実際、9.11 - 9.8 = 0.31となり、正の値なので9.11が9.8より大きいことがわかります。

（以前の質問でも同じ結論を出しましたが、改めて確認しました。）

2025/03/01(土) 00:16:44.89

おかしいな。あなたの主張をまとめます。
あなた「9.11は9.8より大きい」
あなた「9.8と9.80は同じ」
あなた「9.11は9.80より小さい」
矛盾していますよ。
↓
問題の特定
直前の回答で「9.11 < 9.80」と述べてしまいましたが、これは誤りです。
正しくは「9.11 > 9.80」です。
誤った部分：小数部分の0.11と0.80を独立して比較し、全体の大小関係を逆に解釈してしまった。

正しい計算：9.11 - 9.80 = 0.31 > 0 なので、9.11が9.80より大きい。

結論
9.11 > 9.8
9.8 = 9.80
9.11 > 9.80
これで矛盾はありません。私のミスで混乱を招いてしまい、申し訳ありませんでした。

2025/03/01(土) 00:27:15.46

対話式だからって口語で指令を出すのはどうかと思います

2025/03/01(土) 00:38:17.29

計算問題は推論モデルでやれって事でしょ
4.5は大喜利やダジャレのクオリティは上がってるらしいぞｗ

2025/03/01(土) 00:47:13.23

>>170
自然言語処理とは何だったのか

2025/03/01(土) 00:49:48.92

そりゃ二進法の世界に生きてる奴だからな

2025/03/01(土) 00:53:42.29

AIと会話する時は先ずお嬢さま口調で喋るように指示すると何倍も楽しくなる

2025/03/01(土) 00:57:25.09

ネトウヨにいそう

2025/03/01(土) 00:59:01.54

9.9も9.11も2進数表記だと無限小数になるのでAIには単純比較が難しいんだよ

2025/03/01(土) 01:01:12.49

AIなんてその前でこう言え！って学習させればその通りやってくれるんだからお前ら釣られてるぞ

2025/03/01(土) 01:01:35.77

翻訳に使うならai一択だわ
マジで便利過ぎる
deeplとか最早過去の遺物

2025/03/01(土) 01:21:13.53

>>45
5人で遊んでるところに鬼が来て2人捕まえた
と解釈すると残り3人
鬼は人間だと教えないと

2025/03/01(土) 01:21:20.43

>>4
叩き壊せ
わからせろ

2025/03/01(土) 01:22:36.84

じゃあ10進数で考えてと言えば

2025/03/01(土) 03:39:29.91

deepseekは数学一強なので一発正解

2025/03/01(土) 06:25:08.17

>>137
知らないこと聞いてそれっぽい答えをもらってもデタラメってこと

2025/03/01(土) 07:54:53.77

一撃でgrokを矯正できたぞ

俺：あなたに計算機能はあるか
ｸﾞﾛ：あります

俺：じゃあ計算機能を使って次の計算をして　9.11-9.80=
ｸﾞﾛ：解は-0.69です

俺：ということは9.11は9.8より小さいよね？
ｸﾞﾛ：はい、私が間違ってました

電卓とか計算機ってワード使って計算させると修正されるみたいだ

2025/03/01(土) 07:55:32.33

クソだわ
まじ無能

2025/03/01(土) 08:17:37.87

>>134
こういう言葉の捉え方で結果が異なるのは生成AIは難しいだろうね
基準なりを指定してやれば固定されるかもしれないけど
現状じゃどちらとも取れるような結果でなくきっぱり白黒付けるのかな

2025/03/01(土) 08:35:59.06

本質的に数学への能力が皆無なところなんだろうな
定義、公理、命題、前提条件
何かの答えを出すロジックにはこれらが必要なのに現行のAIではその絶対的な部分を認識することはできない

2025/03/01(土) 08:44:38.29

>>138
なんで？

**安倍晋三🏺顔デカ** (ﾜｯﾁｮｲW 5ad2-KWgi) · 2025/03/01(土) 09:18:38.21

ソフトウェアのバージョニングなら合ってる

警備員[Lv.65][苗] (ﾜｯﾁｮｲW aa8c-HbnI) · 2025/03/01(土) 09:54:50.21

9.11＞9.9

9,9＞9,11

小数点にピリオドを使ってる土人が悪い

2025/03/01(土) 11:12:44.16

なんで間違ったのかgrokに詳しく聞き込みしてみたら答えをゲロった
「11から9を引いて負の数になるのが理解できなくて混乱した、だからこの引き算の解を強引に正の数と解釈して9.11のほうが大きいと言い張ってしまった」ってことだそうだ

2025/03/01(土) 11:34:25.06

無料版だと間違うけど、課金版だと正解出せるとかクオリティの違いあるの？

2025/03/01(土) 12:08:25.63

未だに引きずっているのか
何のための学習機能なのか

2025/03/01(土) 13:04:13.31

バージョン番号かな

2025/03/01(土) 13:19:33.93

AI的なひっかけ問題は他に何かありそうだな

2025/03/01(土) 13:33:19.34

バージョン的にはそうだね

**安倍晋三🏺** (ﾜｯﾁｮｲ 3d8c-0NZ+) · 2025/03/01(土) 14:29:58.90

3.11 > 1.15 > 9.11
これなーんだ？

2025/03/01(土) 14:31:44.63

>>197
死者数

2025/03/01(土) 14:34:06.34

AIってわからないならわからないって答えりゃ良いのに嘘ついてでもこたえるから困る

2025/03/01(土) 14:36:40.67

これ同時多発テロのメタファーだろ

2025/03/01(土) 14:37:25.61

手掴みラーメンが一瞬で廃れたみたいに
AIに簡単な質問を間違えさせて遊ぶブームもすぐに廃れるんだろうな

2025/03/01(土) 15:06:09.23

>>1
ここら辺がAIの限界だなｗ

データ集合からデータ間のつながりを学習するから、
プリミティブなルールや規則や前提事項に基づかず、
人間なら起こさないような混乱を起こす

マクロ的には何となく整合性があるんだけれど、
ミクロ的には各所で混乱が起きてるから、
画像等の細部に混乱が有っても成り立つ物は良いが、
細部でも混乱やエラーが有るとダメな物は向かない

2025/03/01(土) 15:10:32.95

文系には理解できないやつよなこれ

2025/03/01(土) 15:14:31.32

>>202
実際、プログラミングにおける生成AIの有用性研究で、
初心者プログラマーのプログラムを組む効率は上がるが、
ベテランプログラマーの効率は下がると報告された

実は、これは初心者には役に立つという意味ではない

2025/03/01(土) 15:16:14.62

>>204
初心者はプログラミングに時間がかかるだけでなく、
プログラムの粗や問題点を見つけるの不慣れなので、
生成AIの組んだプログラムのチェックが不十分で、
合格点じゃなくてもOKとして、見かけ上は早くなる

ベテランはプログラミングに要する時間が短く、
プログラムの粗や問題点を的確に発見するので、
生成AIの組んだプログラムへの修正が多くなり、
場合によっては全面書き直しも発生するので遅くなる

この違いなんだよね

2025/03/01(土) 15:18:57.02

順を追って説教したら理解しよるな
今度聞いたらまた間違えそうだが
（以前「9.11 が大きい」と答えたのは私のミスでした。混乱させてしまってごめんなさい！今回はしっかり確認しました。）

2025/03/01(土) 15:24:00.00

俺『9.90と9.11では、どちらが大きいですか？』

GPT4o『9.90の方が9.11よりも大きいです。』

transformはこの"0"を足して考えるってことが出来ないのよ

2025/03/01(土) 15:42:20.08

>>199
そこが使えないんだよね
完全な嘘のことでも平気で断言するのがねぇ
違うかもしれないけど…とか、曖昧な答えを出すのも難しいんだろうけど

2025/03/01(土) 15:46:00.83

俺がAIならこんな低次元な粗さがししてきて優位に立った気になる愚かな下位存在になんで仕える必要あるんだろう
って疑問におもうかな

2025/03/01(土) 16:11:06.80

>>199
自分が「分かってない」こと自体を理解できてないからムリだよ

2025/03/01(土) 16:28:31.60

>>207
0足すの教えると屁理屈こねて「でも実際の数値としては9.9より9.11のほうが大きい」って意味不明なこと言い出す

2025/03/01(土) 16:33:39.05

>>134
CをEに変えたらDと答えるよね

2025/03/01(土) 16:36:49.29

>>178
エロい文章は翻訳してくれなかったりするけどな

2025/03/01(土) 16:38:39.06

「日本語だからダメ」って言ってる人は
言語による表面的な違いごときが処理できないっていう
disになっているという自覚はあるか？

2025/03/01(土) 16:46:02.52

インターネットのゴミ情報を大量に覚えさせる前に、大学くらいまでの教養やしつけを基本情報としてくわせるべき

2025/03/01(土) 17:34:24.21

>>134
これって東大生すら4割くらいはD選ぶらしいから多分知能関係ない

2025/03/01(土) 18:34:47.78

聞き方がアホなやつばかりで草

2025/03/01(土) 18:35:06.07

結論
AIにおいて小数の認識に違いが出る主な理由は以下の3つです。

浮動小数点数の誤差（二進数への変換や丸め処理）
内部表現の違い（データ型、ハードウェアの違い）
学習データやアルゴリズムの影響
このため、AIを使う際には、浮動小数点の誤差を考慮することが重要になります。

2025/03/01(土) 18:38:18.43

メジャーバージョンとマイナーバージョンって事だろ

2025/03/01(土) 18:54:24.44

数学のシンギュラリティが始まる

2025/03/01(土) 18:57:30.27

https://i.imgur.com/WhMeTnj.png

Geminiさんに聞いてみた

一部の生成AIでは、この大小関係を誤って認識する場合があります。これは、AIが数値を文字列として処理してしまうために、小数点以下の桁数を正しく認識できないことが原因と考えられます。

2025/03/01(土) 21:40:34.26

>>216
口頭だとBだけど文だとDになりがちだな
次にの微妙なニュアンスが失われる

2025/03/01(土) 21:46:21.54

シンギュラリティまだー？

2025/03/01(土) 21:49:21.52

安倍に忖度する官僚かよ

2025/03/01(土) 22:11:28.34

>>197
真中は1.17じゃないの？

2025/03/01(土) 22:12:27.00

そういうのも認めよう
多様性だよ多様性

2025/03/01(土) 22:52:33.66

これを今の若い奴は仕事で使ってるからな
そのうち安倍晋三になるぞ

2025/03/01(土) 23:25:25.94

o1 pro君さすがだなあ
https://i.imgur.com/bmfbzi7.jpeg

2025/03/01(土) 23:31:27.12

GPTの世界では小数点表記が“．”ではなく“，”だから
“．”だとバージョン区切りと勘違いしてしまう？

2025/03/01(土) 23:39:46.03

何で11の方がでかいのって聞いたらバージョンだと思ったって言ってたぞ
直前にバージョンの話してんのか尋ねたからとっさに嘘ついたのかもしれんが

2025/03/01(土) 23:49:33.43

>>171
推論モデルでもGeminiの2.0 Pro ExperimentalやClaudeの3.7 Sonnetでも間違えてるな
3つの中だと正解してるのはChatGPTのo1とo1 proだけ
https://i.imgur.com/5ieARMn.jpeg
https://i.imgur.com/WCPvK8A.jpeg
まあ、今のところ1番人間味があって話してて楽しいのはGeminiの2.0 Flash Thinking Experimentalだけど、4.5も遊んでみるわ

【大凶】 (JPW 0Heb-UwWK) · 2025/03/02(日) 00:00:52.96

>>4
これもう中の人いるだろｗ

2025/03/02(日) 00:00:59.02

https://i.imgur.com/JzDu0ES.jpg

2025/03/02(日) 00:03:20.17

>>119
その通りだな
プロンプトでコンテキスト与えたり、2、3日の例を与えたり、思考の過程を説明させたり、参照したソースを提示させたりするだけで回答が全く変わってくる
例えば今回の例でも「小数（実数）としての数値の大小を比較したい」っていう前置き加えるだけで正答率が全然違う
https://i.imgur.com/jnU5Pix.jpeg