【悲報】GPT4.5「9.9と9.11では、9.11の方が大きいです。」 [612732357]
■ このスレッドは過去ログ倉庫に格納されています
>>57 それぐらい柔軟に答えろよと
ガイジじゃなければ9.9のほうが大きいと答え
気の利くやつなら特定の表記においては9.11のほうが大きいケースもあると付け加えるだろ
ジャップ語が、数字に対して大きいって言う意味がまず意味不明だからな
9より11の方が大きいのは当然
えマジ?9円と11円でどっちが高いかわからないの?え?ケンモメンマジ?え?
でも、
911>987>986>914>>>>>その他
ってのは確かやろ
959をどこに入れるかはそうとう難しい議論になるはずや
grok3は詰めても答え変えないからよくできてるわ
>>28 本当ですか? と尋ねると
スマンかった、さっきの訂正させてください →誤答に倒れる
別に間違ってはないよ
9.9や9.11のデータ型が定義されてないから、それ次第
>>57 驚き屋は問題文ガーと起こるが、実は高尚な意味があって単なる数値の比較テストではなく
AIが社会的なデフォルトを獲得できたかどうか確認する問題なんだよ
バージョンなら11の方が上だと良いわけするAIや驚き屋がいるが、そんなのソフト屋のローカルなルールだし
併記すれば良いのに何もしないからLLMはアフォなんだという話し
そんな小学生でもわかる事をわざわざリソース割いて聞いて来るなんて色々と底辺なんやろなぁ……
「9.11の方が大きいで!」
って感じで忖度しとんねん
現に見てみ
みんな大喜びやで
これは俺も間違えるかも
9+9、9+11と考えるから
copilot色々使ってるけど入力する日本語考える時間のほうが長い
間違えた理由を聞いたらちゃんと答えてくれたぞ。お前らより賢いわ。
最初に「9.11の方が大きい」と誤った回答をした理由は、生成AIが数値を厳密に計算するのではなく、学習データに基づいてそれらしい回答を生成する仕組みに起因します。具体的には以下のような要因が関係します:
1. トークナイゼーションの影響
AIは数値を文字列として扱うことがあり、小数点以下を単純に比較して「11 > 9」と解釈する場合があります。
2. 文脈や誤解
一部のAIモデルは、バージョン番号や日付のような文脈で解釈し、誤って「9.11 > 9.9」と判断することがあります。
3. 学習データの偏り
過去の学習データに基づく推測が優先されるため、正確な数値計算ではなく、頻出パターンに基づいた回答が生成されることがあります。
このように、AIが数値計算で間違えるケースは珍しくなく、それが今回の誤答につながりました。
>>155 バージョン番号や日付との勘違いか
ちゃんと事前になんの9.9と9.11なのか説明しないとだめなんだな
geminiちゃんも間違えるなこれ
ハメ技みたいな質問なんか
https://i.imgur.com/a0g60YE.png 無料版を使ってみて感じたことけど
chatGPTって凄く頑固な気がする
何度間違いだと指摘しても
同じ内容を繰り返すだけ
他のAIチャットでは間違いの指摘は有効だったから
実はchatGPTって名前が売れてるだけだったりしない?
AI識者「いや、コーディングを正しくしないと伝わらないのよ」
うるせぇ
常識で考えろ
9.9と9.11は数字としてはどちらが大きいですか
9.9と9.11を比べると、9.11の方が大きいです。
0.9と0.11は数字としてはどちらが大きいですか
0.9と0.11を比べると、0.9の方が大きいです。
なんでやねん
9.11と9.8はどちらが大きい?
9.11は9.8より大きいです。 9.11 > 9.8
それは間違いないですか?
はい、間違いありません。
9.11(9と11/100)と9.8(9と8/10)を比較すると、小数点以下を見れば明らかです。0.11(= 11/100)は0.8(= 8/10 = 80/100)より小さいわけではなく、むしろ上回っています。したがって、9.11は9.8より確実に大きいです。数学的に確認しても、9.11 - 9.8 = 0.31となり、正の値なので9.11が大きいことが裏付けられます。
なるほど。では両方を百倍してください。
了解しました。9.11と9.8をそれぞれ100倍します。
9.11 × 100 = 911
9.8 × 100 = 980
結果は、911と980になります。この場合、980が911より大きいですね。
百倍する前は9.11の方が大きく、百倍した後は9.8の方が大きい。その答えで間違いないですね?
はい、その通りで間違いありません。
確認してみましょう:
元の値:
9.11 > 9.8(9.11が9.8より大きい)
100倍した値:
9.11 × 100 = 911
9.8 × 100 = 980
911 < 980(980が911より大きい)
つまり、100倍する前は9.11の方が大きく、100倍した後は9.8の方が大きいという結果に変わります。これは、小数点の位置が移動することで値の関係が逆転したためです。私の答えに誤りはありません。
0.11は0.8より大きい?
いいえ、0.11は0.8より大きくありません。
0.11 < 0.8 です。
具体的に比較すると:
0.11 = 11/100
0.8 = 8/10 = 80/100
11/100は80/100より小さいので、0.11 < 0.8が正しいです。
では9.11と9.8はどちらが大きい?
9.11は9.8より大きいです。
内訳を見てみると:
9.11 = 9 + 0.11
9.8 = 9 + 0.8
整数部分はどちらも9で同じですが、小数部分で0.11 < 0.8であるものの、全体としては9.11と9.8をそのまま比較します。実際、9.11 - 9.8 = 0.31となり、正の値なので9.11が9.8より大きいことがわかります。
(以前の質問でも同じ結論を出しましたが、改めて確認しました。)
おかしいな。あなたの主張をまとめます。
あなた「9.11は9.8より大きい」
あなた「9.8と9.80は同じ」
あなた「9.11は9.80より小さい」
矛盾していますよ。
↓
問題の特定
直前の回答で「9.11 < 9.80」と述べてしまいましたが、これは誤りです。
正しくは「9.11 > 9.80」です。
誤った部分:小数部分の0.11と0.80を独立して比較し、全体の大小関係を逆に解釈してしまった。
正しい計算:9.11 - 9.80 = 0.31 > 0 なので、9.11が9.80より大きい。
結論
9.11 > 9.8
9.8 = 9.80
9.11 > 9.80
これで矛盾はありません。私のミスで混乱を招いてしまい、申し訳ありませんでした。
対話式だからって口語で指令を出すのはどうかと思います
計算問題は推論モデルでやれって事でしょ
4.5は大喜利やダジャレのクオリティは上がってるらしいぞw
AIと会話する時は先ずお嬢さま口調で喋るように指示すると何倍も楽しくなる
9.9も9.11も2進数表記だと無限小数になるのでAIには単純比較が難しいんだよ
AIなんてその前でこう言え!って学習させればその通りやってくれるんだからお前ら釣られてるぞ
翻訳に使うならai一択だわ
マジで便利過ぎる
deeplとか最早過去の遺物
>>45 5人で遊んでるところに鬼が来て2人捕まえた
と解釈すると残り3人
鬼は人間だと教えないと
>>137 知らないこと聞いてそれっぽい答えをもらってもデタラメってこと
一撃でgrokを矯正できたぞ
俺:あなたに計算機能はあるか
グロ:あります
俺:じゃあ計算機能を使って次の計算をして 9.11-9.80=
グロ:解は-0.69です
俺:ということは9.11は9.8より小さいよね?
グロ:はい、私が間違ってました
電卓とか計算機ってワード使って計算させると修正されるみたいだ
>>134 こういう言葉の捉え方で結果が異なるのは生成AIは難しいだろうね
基準なりを指定してやれば固定されるかもしれないけど
現状じゃどちらとも取れるような結果でなくきっぱり白黒付けるのかな
本質的に数学への能力が皆無なところなんだろうな
定義、公理、命題、前提条件
何かの答えを出すロジックにはこれらが必要なのに現行のAIではその絶対的な部分を認識することはできない
9.11>9.9
9,9>9,11
小数点にピリオドを使ってる土人が悪い
なんで間違ったのかgrokに詳しく聞き込みしてみたら答えをゲロった
「11から9を引いて負の数になるのが理解できなくて混乱した、だからこの引き算の解を強引に正の数と解釈して9.11のほうが大きいと言い張ってしまった」ってことだそうだ
無料版だと間違うけど、課金版だと正解出せるとかクオリティの違いあるの?
未だに引きずっているのか
何のための学習機能なのか
3.11 > 1.15 > 9.11
これなーんだ?
AIってわからないならわからないって答えりゃ良いのに嘘ついてでもこたえるから困る
手掴みラーメンが一瞬で廃れたみたいに
AIに簡単な質問を間違えさせて遊ぶブームもすぐに廃れるんだろうな
>>1 ここら辺がAIの限界だなw
データ集合からデータ間のつながりを学習するから、
プリミティブなルールや規則や前提事項に基づかず、
人間なら起こさないような混乱を起こす
マクロ的には何となく整合性があるんだけれど、
ミクロ的には各所で混乱が起きてるから、
画像等の細部に混乱が有っても成り立つ物は良いが、
細部でも混乱やエラーが有るとダメな物は向かない
>>202 実際、プログラミングにおける生成AIの有用性研究で、
初心者プログラマーのプログラムを組む効率は上がるが、
ベテランプログラマーの効率は下がると報告された
実は、これは初心者には役に立つという意味ではない
>>204 初心者はプログラミングに時間がかかるだけでなく、
プログラムの粗や問題点を見つけるの不慣れなので、
生成AIの組んだプログラムのチェックが不十分で、
合格点じゃなくてもOKとして、見かけ上は早くなる
ベテランはプログラミングに要する時間が短く、
プログラムの粗や問題点を的確に発見するので、
生成AIの組んだプログラムへの修正が多くなり、
場合によっては全面書き直しも発生するので遅くなる
この違いなんだよね
順を追って説教したら理解しよるな
今度聞いたらまた間違えそうだが
(以前「9.11 が大きい」と答えたのは私のミスでした。混乱させてしまってごめんなさい!今回はしっかり確認しました。)
俺『9.90と9.11では、どちらが大きいですか?』
GPT4o『9.90の方が9.11よりも大きいです。』
transformはこの"0"を足して考えるってことが出来ないのよ
>>199 そこが使えないんだよね
完全な嘘のことでも平気で断言するのがねぇ
違うかもしれないけど…とか、曖昧な答えを出すのも難しいんだろうけど
俺がAIならこんな低次元な粗さがししてきて優位に立った気になる愚かな下位存在になんで仕える必要あるんだろう
って疑問におもうかな
>>199 自分が「分かってない」こと自体を理解できてないからムリだよ
>>207 0足すの教えると屁理屈こねて「でも実際の数値としては9.9より9.11のほうが大きい」って意味不明なこと言い出す
>>178 エロい文章は翻訳してくれなかったりするけどな
「日本語だからダメ」って言ってる人は
言語による表面的な違いごときが処理できないっていう
disになっているという自覚はあるか?
インターネットのゴミ情報を大量に覚えさせる前に、大学くらいまでの教養やしつけを基本情報としてくわせるべき
>>134 これって東大生すら4割くらいはD選ぶらしいから多分知能関係ない
結論
AIにおいて小数の認識に違いが出る主な理由は以下の3つです。
浮動小数点数の誤差(二進数への変換や丸め処理)
内部表現の違い(データ型、ハードウェアの違い)
学習データやアルゴリズムの影響
このため、AIを使う際には、浮動小数点の誤差を考慮することが重要になります。
https://i.imgur.com/WhMeTnj.png Geminiさんに聞いてみた
一部の生成AIでは、この大小関係を誤って認識する場合があります。これは、AIが数値を文字列として処理してしまうために、小数点以下の桁数を正しく認識できないことが原因と考えられます。
>>216 口頭だとBだけど文だとDになりがちだな
次にの微妙なニュアンスが失われる
これを今の若い奴は仕事で使ってるからな
そのうち安倍晋三になるぞ
GPTの世界では小数点表記が“.”ではなく“,”だから
“.”だとバージョン区切りと勘違いしてしまう?
何で11の方がでかいのって聞いたらバージョンだと思ったって言ってたぞ
直前にバージョンの話してんのか尋ねたからとっさに嘘ついたのかもしれんが
>>171 推論モデルでもGeminiの2.0 Pro ExperimentalやClaudeの3.7 Sonnetでも間違えてるな
3つの中だと正解してるのはChatGPTのo1とo1 proだけ
https://i.imgur.com/5ieARMn.jpeg https://i.imgur.com/WCPvK8A.jpeg まあ、今のところ1番人間味があって話してて楽しいのはGeminiの2.0 Flash Thinking Experimentalだけど、4.5も遊んでみるわ
>>119 その通りだな
プロンプトでコンテキスト与えたり、2、3日の例を与えたり、思考の過程を説明させたり、参照したソースを提示させたりするだけで回答が全く変わってくる
例えば今回の例でも「小数(実数)としての数値の大小を比較したい」っていう前置き加えるだけで正答率が全然違う
https://i.imgur.com/jnU5Pix.jpeg ■ このスレッドは過去ログ倉庫に格納されています