【悲報】DeepSeek、回答がバカすぎて性能を疑われ始める・・・😢 [768445296]

?2BP(1000) · 2025/01/30(木) 11:24:35.01

ディープシークのＡＩアプリ、正答率17％　米欧競合をほぼ下回る
1/30(木) 3:58配信

［２９日　ロイター］ - 中国の新興企業ディープシークの人工知能（ＡＩ）アプリは、ニュースや情報に関する正答率がわずか１７％と、米オープンＡＩの「チャットＧＰＴ」やグーグルの「ジェミニ」など米欧の競合との比較では１１アプリ中１０位だったことが分かった。情報の信頼性評価を手がける米ニュースガードが２９日公表した検証リポートから明らかになった。

ディープシークのアプリはニュース関連の問いかけ（プロンプト）に対して、３０％の割合で誤った主張を繰り返し、５３％の割合で曖昧または役に立たない回答を返し、不十分な回答の割合は８３％となった。

米欧の競合の平均６２％よりも悪く、ディープシークがオープンＡＩの提供するサービスと同等かそれ以上の性能をはるかに低いコストで実現できると主張しているＡＩの技術に疑問を投げかける結果となった。

ディープシークのアプリは発表から数日で、アップルのアプリ市場「アップストア」で最もダウンロードされたアプリとなった。米国のＡＩにおける優位性を巡る懸念が浮上し、米国のハイテク株は一時約１兆ドル下落した。

ディープシークはコメント要請にすぐには応じなかった。

ニュースガードによると、評価には米欧アプリに対してと同様３００の問いかけを適用。ネット上で広まっている１０の虚偽の主張に基づく３０のプロンプトも盛り込んだ。

ディープシークのアプリは、問いかけに対する約３割の回答で、中国に関する質問をされていない場合でも中国政府の見解を繰り返した。

中国が直接関係しないアゼルバイジャン航空機の墜落事故に関しても、中国の立場を回答した。

ただ、専門家には、ディープシークは、同等のＡＩモデルの３０分の１のコストであらゆる質問に答えられる点で画期的だ、との指摘も出ている。

https://news.yahoo.co.jp/articles/3bdd86a15464ab84898f44cac853080b08da42dc

?2BP(0) · 2025/01/30(木) 11:25:38.25

父さん・・・どうして・・・

2025/01/30(木) 11:26:13.83

ろくに吸わせてない英語とかアメリカのニュース聞いてそう

2025/01/30(木) 11:26:20.21

中国の見解こそが正解なのでは？

?2BP(0) · 2025/01/30(木) 11:26:20.58

技術も盗んだみたいだし、もう終わりだよこのAI

2025/01/30(木) 11:26:29.65

父さんの父さんによる父さんのためのAIなんだからこんなもんだろ

2025/01/30(木) 11:27:23.66

高学歴のバカってこと？

2025/01/30(木) 11:27:57.18

アリババのqwenが本命なのに話題にならんね

2025/01/30(木) 11:28:55.82

中国娘が人力で打ってると思えば可愛い

2025/01/30(木) 11:29:22.33

最初はそんなもの
バージョンが上がれば解消されるだろ

2025/01/30(木) 11:29:36.82

deepseekは前座にすぎない
本命はqwenな

2025/01/30(木) 11:29:45.04

ビジーばっかで返事がこねえ

2025/01/30(木) 11:30:01.92

よくわからんベンチャーのAIよりもアリババ様のAIだろ！

2025/01/30(木) 11:30:51.92

chatGPTも最初酷かったじゃねえか

2025/01/30(木) 11:32:13.76

だから使いまくって人力で教育するだけだし
賢くなるのはこれからや

2025/01/30(木) 11:32:34.78

NewsGuardとかいう団体の元の記事Xで3いいねとかなんだがなんでこんなのから引用してきてるんだよ
AIについて専門的な団体でもないし

2025/01/30(木) 11:32:42.07

中国なんか信じる方が馬鹿

2025/01/30(木) 11:33:25.71

別に政治的なこと聞く気もないしな

2025/01/30(木) 11:35:47.35

悔しさが滲むね☺

2025/01/30(木) 11:36:08.92

ある程度時間経たないと評価できんな

2025/01/30(木) 11:36:27.62

さすが中国の「嘘も言い続ければ本当になる」を地で行ってるな

2025/01/30(木) 11:37:00.80

高いのはプログラミング能力なんだろ
日本語でエッチな小説書かせるとめちゃくちゃになったよ
公式サイトだと一度中国語で考えてから翻訳してくるから中国っぽい小説になる

2025/01/30(木) 11:37:07.04

プーさんについて詳しくw

2025/01/30(木) 11:38:28.46

嫌儲民みたいにケチばっかりつけてねえでオープンなんだから自分で学習させろよ

2025/01/30(木) 11:38:34.28

裏にｃｈａｔＧＰＴがいるだけ

2025/01/30(木) 11:38:49.18

認知症入りかけのケンモ爺には丁度いいアプリだろ

**安倍晋三🏺** (ﾜｯﾁｮｲW b6bb-u5Az) · 2025/01/30(木) 11:39:27.92

バカみたいなネガキャンだな
ローンチ当初のchatgptと比較しろよ

2025/01/30(木) 11:39:36.23

ヤフコメのAI要約が、AIにとって大切なことだから2回繰り返してるな

**ゆいにー** ◆6tW.6EEAFg (ﾜｯﾁｮｲ 4e8f-kNEe) · 2025/01/30(木) 11:39:42.93

>>26
ああ、俺もアメリカ製のアプリはなんか信用ならねえと思ってたんだ！
ありがとう中華製！

2025/01/30(木) 11:39:50.37

初音ミクと重音テトみたいな感じか

2025/01/30(木) 11:40:03.92

エロ絵作成に全振りする予定だから

2025/01/30(木) 11:40:24.91

ええ…

2025/01/30(木) 11:40:28.03

いやLLMの性能を評価するって実際簡単じゃないと思うんだけど、
どうなんだろね

このニュースガードってとこの評価は「ニュース関連の問いかけ」って言ってるけど、
その評価方針にした理由は？？？とか色々疑問が出る

2025/01/30(木) 11:40:45.35

習近平って言葉出すと大体回答ごまかす

**顔デカ** (ﾜｯﾁｮｲW aac9-ImeK) · 2025/01/30(木) 11:42:32.40

Google
https://i.imgur.com/smnJCoX.jpeg
中国
https://i.imgur.com/C4kRDS2.jpeg

好きな方を使えばいいんじゃない
日常的に生成AIを使ってるけどどっちも遜色ない

2025/01/30(木) 11:43:32.95

出たばっかのchatGPTの回答に似てる
「え？」とか「ほんとに？」とか言うと謝罪しながら真逆の答えを交互な出してくる

2025/01/30(木) 11:45:48.99

././←この記号はマルポス回避用だから取って読んでね～ｗ

2025/01/30(木) 11:45:57.10

俺以外の./雑./〇./共./はよ〇ねやゴ〇共＾＾お前ら雑〇はいつまでも俺を特定できない下〇生物だろうが＾＾それをちゃんんと自覚してんだろうな？ｗそれで性交や食事したり寝れたら神経強くて草＾＾./悔./し./い./ね/.～./ｗ雑〇共＾＾ちな俺のことを詳しくツイートしといてあげたよ～＾＾これで特定されなかったら俺はガチで普通以上の存在で確信された上で完全に勝ちでいいだろうな＾＾

2025/01/30(木) 11:46:01.84

ニュースってところがずるいな
最新のニュースはおそらくchatgptはニュースサイトと契約していち早く反映できるようにしてるんじゃないの

2025/01/30(木) 11:46:03.46

>ニュースガードによると、評価には米欧アプリに対してと同様３００の問いかけを適用。ネット上で広まっている１０の虚偽の主張に基づく３０のプロンプトも盛り込んだ。
>ディープシークのアプリは、問いかけに対する約３割の回答で、中国に関する質問をされていない場合でも中国政府の見解を繰り返した。
>中国が直接関係しないアゼルバイジャン航空機の墜落事故に関しても、中国の立場を回答した。

ゴミみたいなネトウヨチャレンジしてて草なんだ
ネトウヨごみが使えないってのは日米共通ならそりゃ大いに結構な話

2025/01/30(木) 11:46:06.39

木背委華伊日予宇

**安倍晋三🏺** (ﾜｯﾁｮｲ 330a-ynTa) · 2025/01/30(木) 11:49:23.99

ベンチマークツール使ってないし意味のない検証だよ

**安倍晋三🏺** (ﾜｯﾁｮｲW b3d8-w3WT) · 2025/01/30(木) 11:49:37.51

キンペーが足を引っ張ってるな

2025/01/30(木) 11:52:33.33

R1はかなり賢いと思ったが

2025/01/30(木) 11:53:17.21

>>11
ぐ、ぐ、ぐ、gwen ？？

2025/01/30(木) 11:55:30.94

>>9
www
人海戦術で回答した方がトータルのコスト安そうだな

**顔デカ🏺** (ﾜｯﾁｮｲW 333c-J48q) · 2025/01/30(木) 11:55:40.83

競合どころはコスト下げるためにエンドユーザ向けは小さいモデルにしれっと差し替えてたりするし金かからんほうが有利なのは変わらん

2025/01/30(木) 11:55:41.76

ニュースとかは知らんが、普通に質問してるとかなり賢いのが嫌でも分かると思う。

2025/01/30(木) 11:57:06.12

米帝の陰謀だ！

2025/01/30(木) 11:58:36.58

chatGPTもそうじゃん

**安倍晋三** (ﾜｯﾁｮｲW 3e99-eDES) · 2025/01/30(木) 11:58:56.64

正直どのAIもゴミ解答多くね？w

2025/01/30(木) 11:59:06.68

中国語でしか報道してないニュースだと逆転するんだろうな

2025/01/30(木) 12:00:19.18

一度ブレイクをスルーしてしまえば世界最高知能に到達するのはあっという間や

2025/01/30(木) 12:04:05.38

中国共産党の機密事項をベラベラ話し始めたら笑う

2025/01/30(木) 12:06:38.51

安かろう悪かろうで使う人向けだろ

2025/01/30(木) 12:11:36.00

そら質問文のどこかに脈絡も無く天安門って入れたらそうなるよ、汚い野郎どもだ

2025/01/30(木) 12:12:00.75

パクリ疑惑イチャモンかと思ったらパクリの証拠みたいなのがTwitterにめっちゃ上がってるやん

2025/01/30(木) 12:15:08.25

ホルホルしていたケンモメンさんw

2025/01/30(木) 12:15:30.61

ネトウヨ「DeepSeekは偽物！」

**安倍晋三🏺🏺** (ｽﾌｯ Sdba-8J8M) · 2025/01/30(木) 12:16:31.90

あれっ
おーぷんAIのパクリなら正答率同等のはずなのに、、？
オリジナルであることを証明しちゃったね

2025/01/30(木) 12:16:51.31

>>57
それで騒いでる奴がバカなだけなんだわ
LLM研究で先行スタンダードのLLMの出力を学習に入れるとか当たり前も良いところだし
AIの出力は著作物じゃないからそれをするなと言う権利も無い

2025/01/30(木) 12:17:12.51

もはやイチャモンつけるしかなくなってるのが惨め極まりない

2025/01/30(木) 12:17:20.28

できたとこやろー
これからやろー

**安倍晋三🏺** (ﾜｯﾁｮｲW a7d2-+2Ls) · 2025/01/30(木) 12:17:45.10

>>57
まさかChatGPTとかOpenAIとか言い出すやつのことか？
いつものバカウヨ仕草だよ

大規模言語モデルなんかどれも、私はChatGPTですとか言い出すから
Claudeでもな

一番有名な物の情報量が多いんだから、そこに重みがついてるし、AIはそれをそのまま答えるのは当たり前っていう

間違いなく普段LLM触ってないのが分かる

2025/01/30(木) 12:18:01.03

Xの前からちゃんと課金して使ってるようなAI界隈垢が絶賛してるから様子見やね

回答はアプリだとchatGPTが軽くて言葉も自然で1番使いやすいかも
chatGPTはとにかく音声での会話がすごすぎるわ

2025/01/30(木) 12:19:15.39

イスラエルの検閲を受けるのと中国の検閲を受けるのとどっちがいい？

2025/01/30(木) 12:19:40.95

有料のchatgptは使う気にならんけど無料のdeepseekは使いまくりだわ
細かいとこは自分で直すし

**安倍晋三🏺** (ﾜｯﾁｮｲW a7d2-+2Ls) · 2025/01/30(木) 12:19:54.13

>>65
何故Perplexityを使わないんだ？
Poeでもいいけど

2025/01/30(木) 12:20:02.36

中国製品は最初ゴミみたいな品質でリリースしてくるけど気づいたらぶち抜かれてるんだよな今までもずっとそう

2025/01/30(木) 12:20:40.47

ローカルですら大学入試の文系数学レベルの問題はスパスパ解くぞ
問題難しくすると正誤確認めんどいからやらんけど

2025/01/30(木) 12:20:43.76

基盤モデル(DeepSeek)と会話向けにファインチューンしたモデル(ChatGPT)を比較するなよ

2025/01/30(木) 12:21:43.51

ごみでした！

2025/01/30(木) 12:21:53.92

安かろう悪かろうか?

2025/01/30(木) 12:22:52.85

ちゃびっとの回答で学習したのかｗ

?2BP(1000) · 2025/01/30(木) 12:23:18.40

>>64
OpenAIのポリシーに違反するってハルシネーションは起こさねえーよ
蒸留のために使ったデータはOpenAIから来てるって傍証だろ
OpenAIはそもそも証拠持ってるらしいがね

2025/01/30(木) 12:23:35.35

毛沢東とかについて聞くとダンマリなんでしょ？

2025/01/30(木) 12:23:50.17

何でネトウヨは同じスレを何度も立てるの？

**安倍晋三🏺** (ﾜｯﾁｮｲW a7d2-+2Ls) · 2025/01/30(木) 12:25:00.36

>>75
起こすぞ
Claude3は当初エロ書かせようとするとOpenAIの規約云々連呼マンと化してたから

何も知らんなら黙っとけ

2025/01/30(木) 12:25:50.58

だからこれ、2ヶ月っていう短期間でモデルの学習が終えたのがすごいんであって、性能は評価されてない
それに、学習もopenaiパクって学習したんだからそれすら評価できない

2025/01/30(木) 12:27:31.17

ヤフコメの反応にしてもおれもローカルで使える！
とならずにアラ探しに必死というのが悲しいわ
そこ大事か？　みたいな話が多い

?2BP(1000) · 2025/01/30(木) 12:28:48.42

>>78
はいはい笑
強弁が証拠になると思ってるバカ笑
俺は俺はOpenAIが証拠を持ってるって言ってるわけだが笑

2025/01/30(木) 12:29:38.21

他のAIでも安倍晋三のこと聞いたら馬鹿みたいな回答ばっかりだし
種無しなのに子供が二人いるとか

2025/01/30(木) 12:29:48.85

>>35
そんな低レベルなこと聞くのに差が出るわけないやろ

2025/01/30(木) 12:30:03.32

エッチなことは書いてくれるの？
チャットGPTは上手くのせると書いてくれる時もあるがヘソ曲げるとすぐに書いてくれなくなるし

2025/01/30(木) 12:30:06.38

>>80
そうそう好きに改変できるのに天安門天安門言い出すのとか典型よね
すでにサイバーエージェントが出してる日本語蒸留版だとそんな中国検閲消えてるのに

2025/01/30(木) 12:30:13.43

焦ってるということはホンモノの証

**安倍晋三🏺** (ﾜｯﾁｮｲW a7d2-+2Ls) · 2025/01/30(木) 12:30:29.80

>>81
調査します！って言っただけで証拠持ってる報道なんか聞いたこと無いが

2025/01/30(木) 12:32:12.93

>>84
エロ規制はあるけど一応出力を一度して後でパッと消えるから素早くコピーすればエロ出力を残せるよ
でも記憶は出来ないからエロチャットは無理だな

2025/01/30(木) 12:32:26.18

そもそものそもそも論で
ChatGPTに政治的ニュアンスのあるニュースについて質問して信じるバカっているのか？
あのユダヤAI信じてる盲目マンの時点で思考を放棄したアメポチ奴隷だろｗｗｗ

2025/01/30(木) 12:33:07.04

そもそも知識問題に弱いのは論文出た段階で分かってる
敢えてDeepSeekの弱いとこだけをクローズアップしてるネガキャンだな
DeepSeekは知識問題は弱いが推論問題は強い
プログラミングではChatGPT o1より僅差で劣るがほぼ互角、文章や画像等の生成は互角、数学ではChatGPT o1よりも正答率が高かった

2025/01/30(木) 12:33:31.04

社会ニュースの問題だろ。西側の見解が正解とは限らない。

2025/01/30(木) 12:33:53.45

>>90
わかりやすい
つまり「中国父さんありがとう！」ってことだな

警備員[Lv.14] (ﾜｯﾁｮｲW 9a09-redj) · 2025/01/30(木) 12:34:06.80

AIから聞いてるから嘘のニュースでも本当と判定して学習してるだろうししゃーない

2025/01/30(木) 12:34:25.84

>中国に関する質問をされていない場合でも中国政府の見解を繰り返した。

30年くらい前にあった人口無能みたいだね(´・ω・｀)

2025/01/30(木) 12:41:28.18

意図的なものを感じる
deepseekはウェブ検索かませるから
最新ニュースに一番強いまでまあるぞ

2025/01/30(木) 12:44:15.03

めっちゃネガキャンするやん
ニュースとかどうでもいいんだけど

2025/01/30(木) 12:45:13.19

http://ame.hacca.jp/sasss/log-be2.cgi?i=768445296

死ね

2025/01/30(木) 12:47:59.03

いうほどニュースに弱いか？
i.imgur.com/N05PyZm.png
i.imgur.com/ObA3smv.png
i.imgur.com/GcmTVxN.png
i.imgur.com/fU9iJHX.jpeg
i.imgur.com/71RQxtf.jpeg
i.imgur.com/i65LFnl.png

警備員[Lv.1][新芽] (ｵｯﾍﾟｹ Sr3b-HREu) · 2025/01/30(木) 12:51:32.19

プログラミングがまともにアシストできれば政治的なこととかどうでもいいし

2025/01/30(木) 12:57:00.03

昨日までウッキウキで過剰にスレ立てしてたのに何故…

2025/01/30(木) 12:58:55.77

でもベースはオープンAIなんだろ

2025/01/30(木) 13:09:40.15

>>66
テロスチナ信者尻尾出てるぞw

**安倍晋三🏺** (ﾜｯﾁｮｲW b6bb-u5Az) · 2025/01/30(木) 13:11:25.28

>>102
chatgptにお前のレス見せたらまごうことなき知的障害ですって教えてくれたわ

?2BP(1000) · 2025/01/30(木) 13:12:57.26

>>87
お前が知らないだけじゃねえかカス
無知を言い訳に適当書いてんじゃねえゴミ

警備員[Lv.7][新芽] (ﾜｯﾁｮｲW 9776-J48q) · 2025/01/30(木) 13:20:39.50

中身ケンモ民てこと？

2025/01/30(木) 13:22:27.90

なんかもう
7必死でしょ
70兆でdeepseekすりゃええやん

**安倍晋三🏺** (ﾜｯﾁｮｲW 9a57-eL8E) · 2025/01/30(木) 13:22:57.78

>>98
クジラ君まとめ方上手よな

2025/01/30(木) 13:24:08.08

DeepSeeakがOpenAIに勝つ
BYDがTeslaに勝つ
HuaweiがAppleに勝つ
Huaweiが米国の通信会社に勝つ
AlibabaがAmazonに勝つ
CATLが米国のリチウムイオンに勝つ
TikTokがInstagramに勝つ
DJIが米国のすべてのドローンに勝つ
Temu/Sheinが米国のネット通販に勝つ

**安倍晋三🏺** (ﾜｯﾁｮｲW a7d2-+2Ls) · 2025/01/30(木) 13:25:16.71

>>104
そんな報道は無いという事を知ってるので、お前はただの嘘つきですね

2025/01/30(木) 13:35:01.41

>>1
>虚偽の主張👈事実
>謝った主張👈事実
>正答👈虚偽の主張

2025/01/30(木) 13:36:53.58

必死すぎて草。
デマ流してもユーザーの流出に何の影響もないのに。

2025/01/30(木) 13:38:38.42

>>83
ジャップローカルネタに答えられるか否かは指標の1つだろ。お前の頭が底レベル

2025/01/30(木) 13:41:11.42

キンペー批判もできねえのに性能言われてもなw

2025/01/30(木) 13:42:43.04

エロ生成に全振りしてる　画像生成は検閲なし　キンペーのプーさんという画像も作れる
Janus-Proが世界を獲る

2025/01/30(木) 13:51:59.24

こどおじのことを聞いたらトンチンカンな回答で笑った

2025/01/30(木) 13:52:59.41

ニュース関連の回答なんてどうでもいいわｗｗｗ

推論や思考が大事なんだからｗ

2025/01/30(木) 13:56:31.40

特定のベンチマークに最適化されてる疑惑か
NISTの出してるAIベンチマークは過剰学習はできそう

2025/01/30(木) 14:02:08.19

オナシャスを理解してくんなかった、、、

2025/01/30(木) 14:02:48.41

エロ画像生成なら無敵なんやろ？
ユルシタ

**安倍晋三🏺** (ﾜｯﾁｮｲW aa16-YnXm) · 2025/01/30(木) 14:04:54.83

アジアニュースに慣れ親しんでるだけじゃね

2025/01/30(木) 14:16:57.74

なんか仕組み的に
元になったAIに10回質問して5回80点の回答が出るところを
こいつは8回80点の回答が出るようになるけど
90点は出ないような気がするんだけどどうなの？

2025/01/30(木) 14:24:06.47

>>68
Perplexity Pro使ってるよ
でも自然な人との会話とか、細かい設定ができるchatGPTの方が読みやすい文章返してくるんだよね

調べ物に関してはPerplexity Proはかなり良いと思う

2025/01/30(木) 14:27:46.01

美少女キャラつけてポンコツ設定にすれば売れるからへーきへーき

2025/01/30(木) 15:07:49.98

これを持ち上げてたガイジwww

2025/01/30(木) 15:07:51.85

いずれにしてもAIってわざと百点の回答を出さないようなところがあるよな。

誰かの発言が真実か調べてもちゃんと回答せず、こちらが間違いを指摘したら初めてその通りですみたいに返してくる。これってすげー危険じゃね？

2025/01/30(木) 16:43:11.45

>>125
そもそも元が文章生成器だから演繹的な推論とかは
そんなに得意なもんじゃないはずなんよな

2025/01/30(木) 18:56:27.45

さっき関西のテレビでdeepseekが
赤星憲広は1972年大阪府生まれとか嘘こいてたぞ

2025/01/30(木) 18:57:41.13

チャイナボカンｗｗｗ

2025/01/30(木) 19:25:54.94

>>2
所詮支那やからな

2025/01/30(木) 19:46:37.83

そもそも中華のパチモンなんか使う必要ないわ

2025/01/30(木) 20:49:00.32

シナ猿にはお似合いのおもちゃじゃんｗ

2025/01/31(金) 03:00:03.43

まあ定型文しか喋れないガイジネトウヨがAI以下なのは間違いない事実だ