【悲報】Nvidiaバブル、終了か。加算演算だけで高速・高性能を実現するAIモデル「BitNet」をMicrosoftが発表し、ハードウェア革命到来 [666250534]

?2BP(1000) · 2024/02/28(水) 21:03:49.07

WirelessWire News
『1ビットLLMの衝撃! 70Bで8.9倍高速　全ての推論を加算のみで!GPU不要になる可能性も』
https://wirelesswire.jp/2024/02/86094/

Microsoftの中国チームがとてつもないLLMをリリースした。それが「BitNet 1.58Bits」だ。

もともとMicrosoftはかねてから「1ビット量子化」の研究を続けて来た。しかし、32ビット浮動小数点での計算が主流な時代にはあまりに野心的で荒唐無稽なプロジェクトに見えていたのは否めない。しかし、現在、大規模言語モデル(LLM;Large Language Model)は8ビット、4ビットで量子化されるのが当たり前になり、量子化しても性能劣化はある程度まで抑えられることも知られるようになった。

昨年10月に発表した「BitNet」は、多くの人々が他のことに気を取られていてほとんど話題にならなかった。
そんな中、満を持して発表された1ビットLLMの性能に関するレポートは、衝撃的と言っていい内容だ。論文のタイトルも堂々と「The Era of 1-bit LLM(1ビットLLMの時代)」としている。

彼らが発表したグラフを引用しよう。
https://i.imgur.com/VMD8HyS.png

まず、最近主流になっている70B(700億)パラメータモデルでの比較である。Llamaの70BとBitNetの70Bモデルを比較すると、BitNetは8.9倍のスループットを誇るという。

「速いだけで回答が微妙なのでは」と心配するのが普通だろう。
そこでLlamaモデルとの比較が載っている。
https://i.imgur.com/zmgoo1X.png

この表によると、BitNetはLlamaよりも3倍高速でしかも高精度ということになる。
PPLは「困惑」の度合いを意味する数値で、低いほど「困惑してない」ことになる。Llamaよりも性能劣化してないどころか性能は上がっている。

また、各種ベンチマークにおいても平均点は同規模のBitNetがLlamaを上回っている。しかもBitNetは規模が大きくなるほどLlamaに対して優位に立つようになっている。

この圧倒的なスピードの秘密は、BitNetが文字通り「1ビットで処理している」からだ。

https://i.imgur.com/1tcsItA.png

?2BP(1000) · 2024/02/28(水) 21:04:01.75

通常、LLMをふくむディープラーニングされたニューラルネットは巨大な行列の積和演算(掛け算と足し算)を必要とする。
推論時も学習時もそうだ。

しかし、1ビット、つまり、行列の中身が0か1しかないのであれば、全ての計算を加算演算のみにできる。
加算と乗算では計算速度も負荷も段違いに異なるため、これだけのスピードの差が出ている。また、当然ながらメモリ効率も高い。

このため、この論文では「積和演算に最適化されたGPUではなく、加算処理のみに特化した新しいハードウェアの出現」までもが予言されている。
今現在、世界各国が血眼になってGPUを確保し、囲い込んでいることを考えると、実に痛快な論文だ。

非常に驚異的なことが書いてあるのだが、残念ながらBitNetによるLLMの実装とモデルはまだ公開されていない。
だから彼らの主張が本当かどうかはまだ誰にもわからないのだが、BitNetTransformerの実装だけは公開されているため、腕に覚えがあるエンジニアなら自分でトレーニングコードを書いて確かめることができる。

いずれにせよ、　この論文が本当だとしたら、とんでもないことが起きることになる。
この業界に居て長いが、本当にいつもいつも、こんなニュースに触れて興奮できるこの時代を生きる我々は幸運としか言えない。
もちろん筆者もBitNetを試してみるつもりだ。

?2BP(1000) · 2024/02/28(水) 21:04:14.43

【論文】
The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits
1 ビット LLM の時代: すべての大規模言語モデルは 1.58 ビット
https://huggingface.co/papers/2402.17764

?2BP(1000) · 2024/02/28(水) 21:04:22.61

Xの反応
https://i.imgur.com/q0wU4Ga.jpg
https://i.imgur.com/teFpjRq.jpg

2024/02/28(水) 21:05:19.66

AIって意外と精度いらんらしいな

2024/02/28(水) 21:05:26.92

一生の宝にするとか言ってたニーサ民売れずに爆死w

🏺 (ﾜｯﾁｮｲW cbaf-shPz) · 2024/02/28(水) 21:05:55.99

まあNVIDIAもMSFチームだからええんやない

2024/02/28(水) 21:06:13.33

っぱ、握るならAMDよ！

2024/02/28(水) 21:06:21.96

一生一緒にNVIDIA

2024/02/28(水) 21:06:50.75

一生一緒に分散投資

**安倍晋三🏺** (ﾜｯﾁｮｲW 4a17-cGN1) · 2024/02/28(水) 21:06:52.75

結局謎の企業よりインテルの方が強いんよ

2024/02/28(水) 21:07:38.84

切り捨てが発生しないから精度よくなるんか？

2024/02/28(水) 21:07:47.90

量子コンピューターと同じ
すごいすごい言われてたけど
この10年間で株が上がったのはnvidia

2024/02/28(水) 21:07:49.00

MS株も買ってるワイ　高みの見物

2024/02/28(水) 21:08:12.76

これ半分Wintelだろ

**安倍晋三🏺** ◆abeshinzo. (JPW 0Hf6-n2GW) · 2024/02/28(水) 21:08:36.61

ゲイツは株売ったしな

2024/02/28(水) 21:09:06.64

ええ

2024/02/28(水) 21:09:23.21

っぱリサ・マリーよ

2024/02/28(水) 21:10:21.57

とうとうでたね。。。

2024/02/28(水) 21:10:38.34

面白そうね

2024/02/28(水) 21:10:48.62

これ抜きにしてもヌビダビスの株価の上がり方は流石に垂直すぎてバブルやろ

2024/02/28(水) 21:10:52.61

NASDAQ100でいいじゃん(いいじゃん)

2024/02/28(水) 21:11:27.90

謎の企業の決算前に発表すればよかったのにやさちいね

**安倍晋三🏺🏺🏺** (ﾜｯﾁｮｲW 87ec-dZ7v) · 2024/02/28(水) 21:11:58.64

中身を1と0と-1で表現してる
なので4値の2bitではないけど3値必要なので正確には1.58bit

こうすることでかけ算があったはずの行列の計算を強制的に足し算引き算無の3種類に落とし込める
加えて演算を進めていくにつれて浮動小数だとノイズが混じっていくが、こっちは精度が落ちようがない

2024/02/28(水) 21:12:25.60

1bitAIか
ネトウヨ時代の到来

2024/02/28(水) 21:12:47.55

実用化は20年後かな

2024/02/28(水) 21:13:04.91

　　まじかー😹

**安倍晋三🏺** (ﾜｯﾁｮｲW 3a0a-RtHD) · 2024/02/28(水) 21:13:11.19

ゲーマー歓喜だろ

**安倍晋三🏺** (ﾜｯﾁｮｲW 46ef-nAC8) · 2024/02/28(水) 21:13:20.66

お前らいつもエヌビ捨ててんな

2024/02/28(水) 21:13:23.08

>>24
1bit？と思ってリンク先見た
そうだね

**安倍晋三🏺** (ｽｯﾌﾟ Sd8a-3aT5) · 2024/02/28(水) 21:13:42.77

つまりどういう事なんだよ

**安倍晋三🏺** (ﾜｯﾁｮｲW 4ad1-lZAw) · 2024/02/28(水) 21:13:58.72

行列演算の手続きを加法一本にして単純化したわけか
誰でも思い付きそうだが何が技術的に難しいんだろう？

2024/02/28(水) 21:14:07.66

これbit低くなる事に精度下がるんだろ

2024/02/28(水) 21:14:16.92

俺のマイクロソフト株が爆上げするんか？

2024/02/28(水) 21:14:26.92

なるほど分からん

**安倍晋三🏺** (ｽｯﾌﾟ Sd8a-3aT5) · 2024/02/28(水) 21:14:47.66

１ビット脳とかバカにされてたのどうして

2024/02/28(水) 21:14:53.36

ざまあみろクソ革ジャン🤣🤣🤣🤣

2024/02/28(水) 21:15:05.35

NVDA売気配つえーな
決算前まで大暴落くるか

2024/02/28(水) 21:15:22.46

難し過ぎてわからん

2024/02/28(水) 21:15:23.05

PER30倍台の成長企業にバブルもくそもないだろ

2024/02/28(水) 21:15:29.35

タイトルかっこよすぎ

2024/02/28(水) 21:16:14.33

1ビット脳とかこれ半分ジャップだろ

2024/02/28(水) 21:16:15.97

>>24
あーやっぱそうか

それで1.58なんや😺

2024/02/28(水) 21:16:21.75

まさか1ビット脳が高評価される時代になるとはな

2024/02/28(水) 21:16:45.17

なんか結局GPUにMapして並列化する方が早いで終わりそうな気がするが

2024/02/28(水) 21:16:53.27

中国人の頭脳は異常

2024/02/28(水) 21:17:08.48

そこまでNividaのプレが下がってる訳でも無いしMicrosoftのプレが上がってる訳でも無いな
様子をうかがっている段階か

🏺 ◆abeshinzo. (ﾜｯﾁｮｲW 43b5-I9k9) · 2024/02/28(水) 21:17:23.53

NVIDIA爆下げしてくれ
株界隈が面白くなるぞ

**安倍🐰** (ﾜｯﾁｮｲW 9e15-R579) · 2024/02/28(水) 21:17:28.92

要はAIの学習法でもっと良いのがありましたってことだよな

2024/02/28(水) 21:17:32.85

>>24
へえ🥺

2024/02/28(水) 21:17:39.64

難しすぎて凄さがまったくわからんwww

**安倍晋三** ◆abeshinzo. (ﾜｯﾁｮｲ c314-7KIL) · 2024/02/28(水) 21:18:17.37

最近は左翼も1bit脳だから精度はその程度で十分だと言うことが判明したんだな

2024/02/28(水) 21:18:36.50

はえー

**安倍晋三🏺** (ﾜｯﾁｮｲW 6fd2-mqoX) · 2024/02/28(水) 21:19:09.50

グラボのせいでPC価格下がらないからとっととなんとかしてくれ

🏺 (ﾜｯﾁｮｲW 0f0d-dU6n) · 2024/02/28(水) 21:19:39.96

殿様気取りの連中が落されるなら支持する

2024/02/28(水) 21:19:58.32

>>2
学習する時点で最初から1.58bitなの？

2024/02/28(水) 21:20:02.58

1ビット脳おじさんが大逆転か？？

2024/02/28(水) 21:20:05.42

どっちにせよ計算は要るから関係ないだろ

**安倍晋三🏺** (ﾜｯﾁｮｲW 6fd2-mfaP) · 2024/02/28(水) 21:20:23.74

>>5
今のAIが真似してるのは、人間の脳みそとかいうガバガバハードウェアだからな

2024/02/28(水) 21:20:48.34

中国人のトップは神レベルだからね🥺
人口多い科学国家の頂点は世界最強🥺

2024/02/28(水) 21:21:05.93

>>51
ものすごく大雑把に言うと
GPUで強引に計算するくらいならSSDにもっとクソデカい容量取って代わりに計算そのものを簡単にしようぜ
くらいの理解でいいよ

ぶっちゃけどうせ直ぐ並列化されてGPU使えるようになって終わると思う

2024/02/28(水) 21:21:29.37

AI界隈はこの調子でしばらく話題が尽きる事は無いのだろうな
見ていると下手なクソ海外ドラマより面白い

**安倍晋三🏺** (ﾜｯﾁｮｲ df19-5UwS) · 2024/02/28(水) 21:21:38.78

>>49
これは学習じゃなくて学習済みモデルに対してやね
たぶん

2024/02/28(水) 21:21:42.70

あんま影響ないやつやね

**安倍晋三🏺** (ﾜｯﾁｮｲ 4e7e-w3el) · 2024/02/28(水) 21:21:47.55

そんなことよりビットコ1000万超えるぞ
乗るしかねえこのビッグウェーブに！！！！🥺

ビットコイン900万
https://greta.5ch.net/test/read.cgi/poverty/1709110779/

2024/02/28(水) 21:22:00.15

下げたら買う
それよりビットコインの方がやべえやろ
量子コンピュータリスクもある

2024/02/28(水) 21:22:25.46

>>56
それはないんじゃないの
1.58bに量子化するんしょ多分
でもそれでちゃんと動くとは思わなかった
嘘のようなホントの話
イソジン

**安倍晋三🏺** (ﾜｯﾁｮｲW ca0d-DUIk) · 2024/02/28(水) 21:23:51.89

俺の16bitメガドライブが火を吹くぜ

2024/02/28(水) 21:24:11.08

中国すげえ

🏺 ◆abeshinzo. (ﾜｯﾁｮｲW 8bcb-sA+W) · 2024/02/28(水) 21:24:38.83

うーん　なんかホログラムディスクで容量何万倍みたいな話に思える
いつ市販されるのこれ？本当にモノになるのか？

2024/02/28(水) 21:25:04.70

働かないで暮らせるようにしてよ

2024/02/28(水) 21:25:25.77

画像AIの計算方法も改善出来るなら凄いけどどうなん
遅すぎて辛いんよ

❤ (ﾜｯﾁｮｲ 3a07-9+AH) · 2024/02/28(水) 21:25:47.69

まぁ実用化は数十年後とかやろ
それまではNvidiaが無双するっしょ

🏺 ◆abeshinzo. (ﾜｯﾁｮｲW 8bcb-sA+W) · 2024/02/28(水) 21:26:29.21

もうね　誇大広告にはうんざりなんですわ
OpenAIの何がすごいかって言うといきなり実物を出して使わせちゃうスタイル
空飛ぶクルマや大阪磯村ワクチンみたいなのはちょっとね

**安倍晋三🏺** (ﾜｯﾁｮｲW 670d-hySn) · 2024/02/28(水) 21:26:47.65

>>4
いつも驚いてんなこいつら

2024/02/28(水) 21:26:58.91

1ビット脳が集まれば最強ってこと！？

2024/02/28(水) 21:27:50.24

NVIDIAだってAI向けのGPU出してるぐらいだしな
AIに需要あるのかわからん時代ならもともとゲーム用のGPUを流用するのが当然だけど
今後はPCにはグラボじゃなくAI専用ボードを搭載するのが自然な流れかもしれん

2024/02/28(水) 21:28:11.58

凄いの出てきたぞ(;´Д`)

画像と音声だけで表現力豊かなポートレート動画を作成する画期的なAI
https://twitter.com/doganuraldesign/status/1762757086109466676
https://twitter.com/thejimwatkins

2024/02/28(水) 21:28:18.41

イカン、１bit脳が凄い賢そうに見えてしまう

2024/02/28(水) 21:28:57.92

それを運用するのにNVIDIAが必要じゃん

2024/02/28(水) 21:29:14.90

もう終わりだよ

2024/02/28(水) 21:29:17.55

3枚目みるとmodelってのが1,0,-1の3種類だけどこれが特徴量ってやつなん
年収とかだとあからさまにそぐわない気がするけど言語モデルとかってのだとこれでOKなの

2024/02/28(水) 21:30:06.56

>>78
凄すぎるやろ

安倍晋三が解き放たれる‥

**安倍晋三** (ﾜｯﾁｮｲW 2a3b-ZkaJ) · 2024/02/28(水) 21:30:14.13

昔から量子化したモデルでも性能はそんなに落ちないって言われてるんだわ
ハードウェアが変わろうと学習時にはやっぱり-1,0,1だとうまくいかないから推論専用な気がする
それにどうせそれがベストになったとしてもCUDAの乗算が要らないってだけで足し算引き算の機能はいるんでしょ

2024/02/28(水) 21:30:31.08

最近NVIDIA株買った民の阿鼻叫喚が気持ちいw
強がってるの受けるわw

**安倍晋三🏺** (ﾜｯﾁｮｲW ca0d-DUIk) · 2024/02/28(水) 21:31:31.35

>>78
2週間遅い

2024/02/28(水) 21:31:40.28

行列演算から乗算が不要になるってだけだからNVIDIAの時代は終わらんし、Tensorコアみたいに専用コアがGPUに搭載されるようになるだろうな

2024/02/28(水) 21:33:02.85

>>72
Can be utilized not just for text but for images and maybe even video or audio processing

だってさ
凄えぞ大丈夫かこれ

🏺 ◆abeshinzo. (ﾜｯﾁｮｲW ff05-wYgF) · 2024/02/28(水) 21:33:13.84

革ジャン一人勝ちの現状打破に頑張ってくれ

🏺 (ﾜｯﾁｮｲW 5a1d-hGhk) · 2024/02/28(水) 21:33:17.06

そのうちソフト化するわな
いつまでも100万もするボート使ってらんない

2024/02/28(水) 21:33:28.03

何言ってるかよく分かんないんだけど

2024/02/28(水) 21:33:37.01

お前らＭＳ株全力でいけ
まだ４００ドルくらいだからお得だしこれからも上がる
AIへの投資もしてて隙がない

**安倍晋三🏺** (ﾜｯﾁｮｲW df0c-sqLA) · 2024/02/28(水) 21:34:14.41

量子化捨ててるなら
1bit違うパラメータで全然違う答え出そう

**安倍晋三🏺🏺🏺** (ﾜｯﾁｮｲW 87ec-dZ7v) · 2024/02/28(水) 21:34:19.44

>>84
GPUが転用されてるのは積和演算器がバケモノみたいな量乗ってるからで
加算器のみでいけるのなら回路がとんでもなく小さくなるしネットワークも回路上に載る可能性がある
そうなるとFPGAの出番で二大メーカーは少し前にAMDとIntelに買収されているというね

2024/02/28(水) 21:35:09.28

>>88
ほー
でも量子化はどうせ質が落ちるから怪しいなぁ
超伝導のアレみたいな雰囲気もあるし
はよテスト版出してや

2024/02/28(水) 21:35:12.42

>>1
なるほど
さっぱりわからん

2024/02/28(水) 21:35:38.07

VRAMをモリモリ消費する現状も改善するのか？
8GBしかないから辛いぞ

2024/02/28(水) 21:35:42.16

お前ら気付けよ

中国支社が発表だぞ

中国…

**安倍晋三** (ﾜｯﾁｮｲ 3310-o+si) · 2024/02/28(水) 21:35:44.73

みんなでAMD買って大富豪にならんか？

2024/02/28(水) 21:35:57.72

結局GAFAMの間で資金が回り続けるんじゃん