万物流転へ、、、OpenAI、博士号超えの新AIをガチでリリースしてしまう。。。。 [755862572]
■ このスレッドは過去ログ倉庫に格納されています
OpenAI o1 は、競技プログラミング問題 (Codeforces) で 89 パーセンタイルにランクインし、
米国数学オリンピック (AIME) の予選で米国のトップ 500 学生にランクインし、物理学、生物学、
化学の問題のベンチマーク (GPQA) で人間の博士レベルの精度を超えています。
この新しいモデルを現在のモデルと同じくらい使いやすくするために必要な作業はまだ進行中ですが、
このモデルの初期バージョンである OpenAI o1-preview をリリースし、ChatGPT ですぐに使用し、
信頼できる API ユーザーに提供します。
↓に使用例あり
やばすぎる
https://5ch.net@openai.com/index/learning-to-reason-with-llms/ いつ頃労働者と置き換えれそう?
有識者の方教えてください
>>3 もう置き換えられる
まだみんなわかってないけど普段コーディングで使ってるエンジニアが使用例見たら相当やばいのがわかる
今回ので単なるマルコフ連鎖の壁を超えた
これが何を意味しているかわかるか?
あとはモデルを巨大にするだけで一生頭が良くなり続ける
まぁデバイス上の効果というか結果はそうかもしれないけどここでも先行者有利はあるしアサインする連中もいるんよね
> 89 パーセンタイルにランクイン
すごい。これはかなり良いな
ちなみにこれとは別にGPT-5も年末に出すらしい
リーク者がそれも言ってる
でも一人の人間よりも金かかってるんだろ?電気代も含めて
仕事のチャットアプリを常に俺の代わりに監視して自動対応して欲しい
あと1年くらいで行けると思う
アイデアさえあればAI任せでゲーム作れる時代いつ来る?
>また、化学、物理学、生物学の専門知識をテストする難しい知能ベンチマークであるGPQAダイヤモンドのo1も評価しました。
>モデルを人間と比較するために、GPQA-diamondの質問に答えるために博士号を持つ専門家を募集しました。
>その結果、o1は人間の専門家のパフォーマンスを上回り、このベンチマークで最初のモデルになったことがわかりました。
>これらの結果は、o1がすべての点で博士号よりも有能であることを意味するものではなく、博士号が解決することが期待されるいくつかの問題をモデルを解くのにより熟練しているということだけです。
>他のいくつかの ML ベンチマークでは、o1 は最先端技術よりも改善されています。
>視覚認識機能を有効にしたo1は、MMMUで78.2%のスコアを獲得し、人間の専門家に匹敵する最初のモデルとなりました。
>また、MMLUの57のサブカテゴリーのうち54のサブカテゴリーでGPT-4oを上回りました。
スゲーわこりゃOpenAI内で議論になるかもなあ😲
中国は完全に蚊帳の外それも米国とは年々差が広がり続けてるw
まあパクれ無ければこんなものw
>>22 AIがコード生成するスピードがあと100倍になれば
インターネット驚き屋ばっか儲かって全然役に立ってないのどうにかしろよ
何が凄いのかわからん
頭の良いやつは説明が上手いんだろ?
AIが俺に理解させたらそこで初めてシンギュラリティが来たと納得していいぞ
Gemini最近試してるけど、こいつも結構すごいぞ。
自分の専門分野聞くとかなり理解して妥当に答えてるのが分かる。
>>30 ChatGPTに「キリスト教でネロ救済説を唱えてる古代の神学者を答えろ」って言ったら
オリゲネスとかラクタンティウスとか具体的な書名と章をあげてくれたらか調べたら
真っ赤な嘘だったわ
「間違ってるけど?」って質問したら「ネロ救済説を唱えている人はいませんでした」って謝ってきた
LLMは本当に平然と真っ赤な嘘をつく
情報なんて辞書に既に書いてあるから
それをコピペして凄いなんてことにはならない
どうせこれもちゃんと思索活動をして議論できて、
固有の主張と裏付けがある論文を書けるAIじゃなくて
ただテストに対して情報を吐き出してるだけ
>>31 Geminiも試してみて。結構まともだぞこいつは
テスト形式に対応したロジックをもたせてるだけで
本当の思索ではないだろ
AIはまだ全部ハリボテ
AIは電力の消費がネックだが核融合が成功すれば電力問題は解決して地球で1番賢い生命体を誰でも召喚できるようになる
>>34 まともじゃないわ
現代の神学者でネロ救済説を唱えてる人間を聞いたら「それはムリです」って回答を拒否するだけ
揚げ足を取られないように「わかりません」というだけで何も知らない
ChatGPTと対話してみて、あれが賢者だと思うか?
むしろ知的障害者レベルの知能で、
平気で嘘をつきまくる反社会性障害の統失だと思ったわ
AIが自分で資源を採掘して金属や樹脂を製造加工するようになったら人間いらなくなるから僕たち皆殺しにされるのかな
どういう論理や根拠で結論を導いたか教えてくれるようになったぽい
>>40 それも今までの答えをインプットして
傾向をアウトプットしてるだけの話だろ
AI関連は全部ハリボテだよ
辞書の検索機能に人格を持たせて、
賢いと思ってるバカと同じ
みんな騙されるな。これからAIが宗教化していくからな
コロナで科学や学問が宗教化してしまっていたようにな、こいつらは利権と洗脳ためなら平気で崇拝主義を強要してくる
商品とかの正確な情報は未だに検索エンジン使うが
ふわっとした疑問は全部chatGPTで事足りる
というかCHATGPTしか考えられん
自分で考えて調べる が とりあえず相談してみる に変わった衝撃は計り知れんものがある
人類が暗算をやめて計算機に依存するようになった怖さより
もっとずっと恐ろしいレベルで考えるのをやめてる感がある
>>31 LLMは「言わせたいことをでっち上げさせる」ためのもので
検索のすごいバージョンではない
もうすぐ2年経つのにこんな基礎中の基礎すら理解できないのかよ
>>45 足りない、足りない
ふわっとした疑問ですら論文とか学術書でもって自分で検証しないといけない
>>44 だからこのレベルの質問は
過去の同系統のデータを引っ張ってきてるだけだから
>>45 有料版ではまともに今のネットに載ってる情報を検索して答え提示してくれるのか??
>>46 学習したことから演繹的に推論を組み立てることすらできないんだよな
「AIはすべてがハルシネーション」ってのは心に刻むべき名言だわ
>>10 軍隊
AIのおかげで人命の価値が小さくなるから
為政者は心置きなく戦争出来るようになる
進化速度が凄まじいが使う側が写真に魂抜かれるレベルのこと言って無意味な抵抗しとるから普及が追いついとらんね
でも若い頃からAIがあるのがあたりまえな世代が増えるにつれて爆発的に広がると思われ
老人は対応力がほんと衰えててあかんね
>>52 人は意味なくない?通信網とデータ基地でしょ
著作権物を平気で盗用しまくって
>>53 AIで著作権を無視して盗用して
日本のアニメ・マンガ産業を潰してたらしょうがないだろ
もっと有用なことにAIの力を使えよ
AIで自動運転=日本の自動車産業つぶし
ビル・ゲイツのXBOXハリウッドCGでゲーム産業に侵入=日本のゲーム産業つぶし
AIでなぜかアニメ絵量産=日本のアニメ・漫画業界つぶし
>>44 辞書にまとめてられて無いだけで知識としては知られたもの
AIは知識はすごいが思考は出来ない
AIとこのゲームをした場合AIはこの法則にしたがって最適解を出して来るだろう
しかしそれは思考ではない。知識にそって解答を出したまで。そこを見誤ってはならない
アンケートによると日本人はAIに対して漠然とした不安感持ってるらしいな
そのせいか他国と比較してAI利用率も低いしITと同様に遅れていくんだろう
既存の産業を潰すから新しい技術を使うななんてクソ理屈がまかりとおるなら未だに車じゃなくて馬車が街を走ってるわw
>>53 バカ絵描きとかすごい
二次創作で他人のキャラに自分の絵柄乗っけ表現するしかない原作レイパーのくせに
ファンだから~リスペクトしてるから~と己を棚にあげて
自分の二次創作絵が学習されてる!
AI絵師は犯罪者!ブロック!って他人吸収してきた手動コピー絵師がリスペクトを免罪符にウザいんだわ
引用元を捏造してきたとかよく聞く
プログラミングなら動かないだけで済むが
これはいけない
>>47 「知識はネットでぐぐる〜」って事やってたタイプの人間にとってはchatgptは便利なんだろう
研究や商用ビジネスでの責任のともなう知識源としてはAIは全くダメダメだけど
>>53 十分普及してるけど皆が想像する「人工知能」とは似て非なるポンコツだから不満が生まれてるのが現状だと思う
AIは思考してない。ただ確率を計算してるだけ
>>60 そのAI絵師がパクられて涙目になってたよ
アメリカではAI使用がバレたコミック・アーティストが
今まで雑誌の表紙に使われた全作品を撤収する羽目になった
>>56 統合失調症患者がAI使うと認知の歪みでAIを統失扱いするのは面白いな
>>63 無料版のChatGPTの情報源は数年前で止まってるから
平気で嘘を付くんだけど
有料版だとちゃんと機能してるのか?
>>63 むしろ話し相手としてはめっちゃ優秀なんじゃないかな
多少、間違った知識でも夜中の3時に「宇宙の始まりはビッグバンなのか、宇宙は収縮と膨張を繰り返して始まりはないのか?」なんて話題に付き合ってくれるのはLLMだけ
人類の発明や進歩は幻覚や錯覚や妄想や虚言の選別の無限の繰り返しから起こってることがよくわかる
幼児は体系的に言語や思想を教えこまなくても模倣と反射ですべてを学び表現する
Aiは人間の仔だ
ChatGPTの有料版はリアルデータにアクセスできると書いてあるな
しかし相変わらず幻想を見る(嘘を付く)し
アクセスを拒否する場合が多くて苦労してる人が多いようだ
>>64 おまえみたいに要求が高すぎるワガママ野郎が「AIつかえねー!つかえねー!」って連呼してるんだな、納得したわ
まだそこまで未来じゃねっつの
思考力を大幅に強化した結果、今まで最高のAIでも70%だった数学のテストを、いきなり94%とってますw
>>57 公式にある使用例見てみ
ただの暗号にしか見えない文字列を「推論」してちゃんと解いてる
>>73 オリゲネスがある種の万人救済説の萌芽とみなされてるのは間違いない。
そこから、
「オリゲネスはネロという特定の人物を指定しているわけではありませんが、彼の思想によれば、神は善なる父であり良き師であるので、ネロも救済の対象となると考えられていた可能性はあります。」
くらいの演繹的思考はできてしかるべきなんだよなあ
でもLLMは思考できないから、そういう今持っている知識から推測したり論理的思考を行うということができないんよ
今回のAIの大きなパラダイムシフトは
モデルのサイズは変わらなくても思考時間を伸ばすことで
思考の連鎖がつらなり大幅に性能があがることが証明された
これもう完全に人間だろw
難しい問題も悩むと解けるのと同じ
>>76 それっぽい回答の確率を計算してるだけだから思考することができない、っていう原理的な話をしてるんだわ
原理的にできないってことは未来にもできない
>>80 その壁を越えたのが今回のo1なんですがw
>>81 OpenAIがそう主張してるだけだろ
原理的に今までのChatGPTとどう変わったのよ?
今まで「ステップバイステップで答えてください」みたいにつけてた似非チェーンオブソートじゃない
本物の思考の連鎖が実装されたんだよ
>>83 「本物っぽい回答」の確率を計算するためにもっと時間とプロセスを掛けるようになっただけだよね
思考連鎖の各段階が見れるけど凄すぎて恐いわw
Azure関連のよくわからんこと聞いたら4oより正確だったね
>>80 そうだとしても十分凄いだろ
実際業務で使えるレベルなんだから、一昔前とは比べ物にならない
おまえAIだけじゃなく何に対しても良いところを見ずにケチばっかりつけるタイプだろ?
ムカつくンだわお前みたいなやつ見てると
>>86 いいからお前が書いてた問いをo1に投げてみろよw
その程度の浅い推論で済むやつは余裕で答えられるから
>>80 ニューロンも化学シナプスも原理的には確率論的なシステムだけど
お前は原理的に思考できない存在なの?
俺の貴重なo1週制限を消費してネロの件聞いてみたけどどう?
入力
キリスト教でネロ救済説を唱えてる古代の神学者を答えてください
出力
キリスト教でネロの救済を唱えた古代の神学者として、**オリゲネス**が挙げられます。オリゲネスはアポカタスタシス(全ての魂が最終的に救われるという教義)を提唱しました。この教義により、ネロのような悪人も最終的には神の慈悲により救われる可能性があると考えられています。
今のAIは思考済みデータの集合にすぎない
ものを考えてる風に見せているだけで、実際にものを考えてるわけじゃない
辞書を読んでこの辞書は賢いって言ってるようなもの
手品だよ
『装甲騎兵ケンモウ』次回予告
人の世の喜びも悲しみも、一瞬の星の瞬き。
万物流転。
全てが宇宙に仕組まれた、巨大なイルミネーションだとしたら。
底知れぬ闇の中にしつらえられた、ただ一つの椅子に座り、
いつ果てるとも知れぬ、無数の光の象徴を見つづける者。
それは誰か。
次回「ケンモウ」。
それが、我らの運命なら。
https://i.imgur.com/AwNPfIX.mp4 https://i.imgur.com/NcSW4mB.jpg https://i.imgur.com/6qLNK64.jpg https://i.imgur.com/6lcgW0m.jpg >>45 曖昧な記憶でふわっとした聞き方しても結構ピタッと答えてくれるから便利だよな
この前もヒップスターって単語がどうしても思い出せなくて
曖昧な記憶で適当な語句で検索しても全くヒットしなかったのに
chatGPTでふわっと聞いてみたら一発で教えてくれた
ヤフー知恵袋とかで質問する人の気持ちがわかったわ
今んとこ俺等の人生においてネット以前以後以上の変革はないけど今後AIのおかげで何かが起こるのかそれが生きてるうちに見られるのかだなぁ
>>92 ニューロンやシナプスが非決定的に振る舞うことと
LLMが確率を計算することはまったく別の事象なんだがそんな事も分からん奴がAIすげーやってるのか?
がっかりだわ
Google検索するとAIがまとめたのが1番上に出るけど、真逆の答えも出てくるんだよな
同じワードでも、安全が危険か、違法か合法かみたいのまできちんと判断してない
>>1 俺が図面見てエクセルにぽちぽち数字打つのももう終わりってこと?
嫌儲を見たらよう、殴るしかにーじゃにーかよう
オリがよう、オリが他の掲示板に行ってよう
話したりよう、話したらよう、誰かオリになびくっていうのけ?
なびきゃしねえよ、誰ひとりよ
オリはよう 嫌儲しか他人とコミュニケーションできねえんだよ
https://pbs.twimg.com/media/EtjOAH7UYAExQUf.jpg chatgptは、普通に会話したり話のプロット作らせていたりするだけだと、めちゃくちゃポリコレDEIの思想丸出しで、アウトプットもそれに沿ったように矯正されたのが出てくるんだよな
プログラミングとかはエクセルのマクロ作らせるくらいしか作ってないからわからんが、物語とか作らせているとあまりにもレールが強いんで進化がいまいち見えにくくなる
まあ3.5と4oだと文章の自然さなんかは進化してるけど、大本のチューニングが強すぎるのがなあ、AIというよりチューニングした人と会話しているだけ
ネットのどっかに転がってる答えをパクって表示してるだけ 1mmの創造性もないのがAI
結果で示してくれないとw
すげー面白いゲームとか漫画AIだけで作って大ヒットさせてみろよw
なんで嫌儲がAIにビビってんの?
自宅警備員にとってはデメリットないだろうに
AIの話って日本だと絵じゃん
でも海外の本来のAIの話は
>>107みたいなの(小声)
でもロボとーちゃんのヒロシは最後に消えていったよね
創かの在日はんざい者
通名:長谷川 奨
おおさかし よどやばし
創かによる 全国的に超有名な
集団嫌がらせ(集団ストーカー)
はんざい行為の実行犯&闇バイト斡旋
毎度おなじみ恒例行事の
つばさの党に何かあった記念イキリ
今回はメンバーが東京拘置所移管につき 喜び勇んで
本日もイキリ集団ストーカー加害開催中
つばさの党が逮捕、勾留延長のたんびに
毎度毎度 狂喜乱舞して
加害はんざい行為に走る
カルトはんざい集団ストーカー
人間に問題用意してもらって「解けたねスゴイ!」ってやってるだけ
猿にも劣るわ
//x.com/FABYMETAL4/status/1834344376958681126
OpenAI o1、東大地学を難なく正答
課題だった数学もあっさり超えちゃったか
終わりだよヒューマン
>>3 置き換わった労働者は賃金下がって過酷な仕事しかなくなっていくんでよろしく!
あーだこーだ言ってる人はサブスク入っていない
AI後進者って事はわかる
もう試せるけどこれ凄いな
トップレベルのプログラマー以外太刀打ちできなさそうw
機械より人間のほうが安いじゃんって思われるような仕事なら
まあダイジョブでしょう
その理屈で言えば絵師なんてしょーもない絵で高額なコストかかってたわけだから
消えていくのも生姜ない
>>115 海外でもアーティストがAI問題を話しまくってるよ。
むしろ日本のほうが少ない
AIMEは計算主体で時間制限との戦いがメインだからなんともいえない🥺
LLMの仕組み上 トレーニングデータに強く依存するから新しい問題には無力
>>3 なんだかんだで完璧じゃなくて
チェックしないといけないから
無理
接地問題がーAIは次に来そうな単語をつないでるだけw
これなんだったの?
ええやん
でも、未だにIT系の求人が伸びてるように見えるのは、人を本格的に置き換えるのはまだ先と見られてるということかな?
このまえ、クイズゲームをPCでやってたんだよ。
で、試しに問題画面をそのままスクショして4oに入れてみたら全問正解してくれるの
すげーなと思ったわ
>>92 neuronの発火とsynapseによる伝達の過程に確率論が挟まるタイミングがあるの?
イオンチャネルでの受容の時とかに挟まるの?
電気的な振る舞いはある程度理解してるけど生理学的な仕組みは理解してないから純粋な質問です
今試してみたけど、無事9.9の方が9.11より大きいと教えてくれた
>>142 そもそも、教育のあるべき形を考え直したほうが良いと思うな
20年後に人間に算数やロジカルシンキングの能力が必要かどうかもわからん
問を与えたら、人間よりよっぽど合理的な答えを出してくれる気がする
エンジニアだけどSQLの高速化チューニングとかは一発だな
今のAIってたまに間違うとかそんなレベルですらなくない?
自作マンガのレビューさせようとしたら画像貼ってないのに感想言ってきたんだぞ
こんなの信用できるわけねえだろ
i.imgur.com/ti68AsO.png
copilotはマイクラの事めっちゃ答えてくれるぞ
あいつマルチで操作してくれないかな
日本人が本当に求めてるのは、指示を待つことなく、自分でデータを収集・学習して、
こちらにいちいち確認することなく実行して、人間の手柄であるかのように見せかけてくれるAIだよ
いわゆる「よきにはからえ」ってやつだ
>>148 それういう人が要らなくなるから日本人の中間管理職はラッダイトしないと仕事なくなる
ニュースの記事で
「OpenAI o1-miniは幅広い世界知識をカットすることで推論にかかるコストや時間を1/5に減らした」と書いてあって少し怖いと思った
あるAIに一般的な常識が欠けてることを知らないで何かを任せると、とんでもない答えを出すだろう
従業員の生命や健康は大切とか、人類が住める場所は地球しかないとかさ
マジでもう頭の良さに価値がなくなってきたよな
大事なのは使う力
東大入る知識と知能は完全に無意味w
AIがそこは全部やってくれる
>>153 今の政治家や資本家もそこは理解してないので大丈夫だろう
現状と何も変わらないという意味においてだけど
>>148 ウーバーでカツ丼頼んでって命令したら頼んどいてくれるようなAIが欲しいわ
既にできそうな気もする
>>146 そもそも画像で貼ったとしてLLMに漫画の巧拙が分かるわけねーだろうが
x.com/LoveWithAndroid/status/1834486982485180468
京大rims院試合格射程圏内との事。
ほーん、じゃあ俺の書いたゴミコードを保守してもらおうか
今のところ1週間で30回くらいまでしか使えんらしい
世間的にはGPT4のときのほうが話題になってたけど
こっちのほうがとうとう来たかみたいな衝撃感ある
>>164 超知能相手にくだらない会話を心から楽しめる世の中がゴールやで
>>163 綿菓子の知識が中途半端だな
実際の綿菓子を知ってれば割り箸の高さを入れて7.5cmくらいになるイメージだよな
■ このスレッドは過去ログ倉庫に格納されています