なぜ日本はGPUのない「富岳」でLLMを研究するのか？外国に後れを取らないための現実的な理由とは [565880904]

?2BP(2000) · 2023/09/11(月) 16:17:44.65

そんな中、日本では理化学研究所と富士通、東京工業大学、東北大学が、スーパーコンピュータ「富岳」を使ったLLMの研究を今まさに進めている。学習手法の研究からデータの法的な扱いまで幅広く検討し、日本のLLM開発の基盤を作るのが目的だ。

　深層学習といえば、今ではGPUを使うのが一般的になっている。しかし富岳はそのGPUを搭載していない。日本にはGPU搭載スパコンも存在するのに、なぜ富岳を使ってLLMを研究するのか。

　今回は富士通研究所・コンピューティング研究所の中島耕太所長と白幡晃一さんに、富岳を使ったLLM研究について、その意義を聞いた。富岳は確かにハイスペックなスーパーコンピュータだ。しかし、LLM研究における活用には、それだけでないもっと“現実的な理由”があった。

LLMの学習には大量の計算が必要になる。では、具体的には何回以上計算すればいいのか。これには一つの答えがあるという。

　その数字が「10の23乗FLOPs」だ。富岳をはじめとするスーパーコンピュータの性能を示すとき「このスパコンの計算速度は○○FLOPsです」のようにいうことがあるが、今回の「FLOPs」は計算速度ではなく計算量を示す単位のこと。平易に書くなら「10の23乗回」となる。10の23乗は日本語でいうと「1000垓」。1兆の1億倍のことだ。

　中島さんによると、過去の研究の中でLLMには不思議な性質が見つかっているという。LLMの学習を進めていると、しばらくはあまり派手な性能向上が見られないのだが、ある時点でなぜか急に能力が跳ね上がり、それまでできていなかったような処理をできるようになる──それが10の23乗FLOPsだ。

　つまり、LLMを開発するならスーパーコンピュータに1000垓回分の計算をさせることが一つの目標になる。

一方で、1000垓規模の計算をするにあたっては、富岳以外の選択肢もある。一般的に深層学習に向いているとされるGPUを搭載したスーパーコンピュータとしては、産業技術総合研究所が構築・運用する「ABCIシステム」が日本最大とされてきた。搭載されているGPUの計算処理性能も富岳のCPUを超えている。

　富士通研究所の白幡さんによると、ABCIシステムを完全に貸し切って10日ほど計算させれば、1000垓規模の計算をすることも「技術的には可能」（白幡さん）という。

　しかし、現実的にはそうもいかない。ABCIシステムはさまざまな組織が共用しているものであり、長時間貸切ることが難しい。性能は高いが占有できないという“現実”がハードルになっている。

　対して富岳は、各CPUの処理性能を見るとABCIシステムのGPUの17.75分の1程度。しかし、現実的に使えるリソースの規模を考慮すると1000垓規模の計算を実現できるのは日本で富岳だけになるという。

https://news.yahoo.co.jp/articles/1bdbea8e1c974b020735b44d446548a1a38d188e

**Moraler.M3wv** (ﾌﾞｰｲﾓ MM93-W+zJ) · 2023/09/11(月) 16:18:05.81

＿_＿_＿_＿

**Moraler.M3wv** (ﾜｯﾁｮｲW b362-ZCI9) · 2023/09/11(月) 16:18:05.89

＿_＿_＿_＿

**Moraler.M3wv** (ｱﾒ MM97-UBJC) · 2023/09/11(月) 16:18:06.39

＿_＿_＿_＿

**Moraler.M3wv** (ﾌﾞﾓｰ MMe6-/Sil) · 2023/09/11(月) 16:18:06.47

＿_＿_＿_＿

**Moraler.M3wv** (ﾜｯﾁｮｲW b3dd-qdSh) · 2023/09/11(月) 16:18:06.49

＿_＿_＿_＿

**Moraler.M3wv** (ｱｳｱｳｳｰ Sa47-IuR+) · 2023/09/11(月) 16:18:06.72

＿_＿_＿_＿

**Moraler.M3wv** (ﾜｯﾁｮｲW b362-lqSE) · 2023/09/11(月) 16:18:07.11

＿_＿_＿_＿

**Moraler.M3wv** (ﾜｯﾁｮｲW b3dd-Uvu+) · 2023/09/11(月) 16:18:07.37

＿_＿_＿_＿

**Moraler.M3wv** (ｱｳｱｳｳｰ Sa47-MCzW) · 2023/09/11(月) 16:18:08.16

＿_＿_＿_＿

**Moraler.M3wv** (ｱｳｱｳｳｰ Sa47-7Jpy) · 2023/09/11(月) 16:18:09.55

＿_＿_＿_＿

**Moraler.M3wv** (ﾌﾞｰｲﾓ MMb6-nBAU) · 2023/09/11(月) 16:18:10.30

＿_＿_＿_＿

**Moraler.M3wv** (ﾌﾞｰｲﾓ MM26-ShII) · 2023/09/11(月) 16:18:10.36

＿_＿_＿_＿

**Moraler.M3wv** (ｽﾌﾟｯｯ Sd5a-Tuf5) · 2023/09/11(月) 16:18:10.86

＿_＿_＿_＿

**Moraler.M3wv** (ﾌﾞﾓｰ MMe6-mtIN) · 2023/09/11(月) 16:18:10.97

＿_＿_＿_＿

**Moraler.M3wv** (ｱﾒ MM97-gQzj) · 2023/09/11(月) 16:18:11.05

＿_＿_＿_＿

**Moraler.M3wv** (ﾌﾞｰｲﾓ MM26-Gwbn) · 2023/09/11(月) 16:18:11.12

＿_＿_＿_＿

**Moraler.M3wv** (ﾌﾞｰｲﾓ MMb6-dIMl) · 2023/09/11(月) 16:18:11.16

＿_＿_＿_＿

**Moraler.M3wv** (ﾜｯﾁｮｲW b362-qumG) · 2023/09/11(月) 16:18:11.55

＿_＿_＿_＿

**Moraler.M3wv** (ﾜｯﾁｮｲW b34a-2Bwg) · 2023/09/11(月) 16:18:11.75

＿_＿_＿_＿

**Moraler.M3wv** (ｽﾌﾟｯｯ Sd5a-GMIv) · 2023/09/11(月) 16:18:11.75

＿_＿_＿_＿

**Moraler.M3wv** (ﾌﾞﾓｰ MMe6-uMNS) · 2023/09/11(月) 16:18:11.83

＿_＿_＿_＿

**Moraler.M3wv** (ﾌﾞｰｲﾓ MM26-odkE) · 2023/09/11(月) 16:18:11.97

＿_＿_＿_＿

**Moraler.M3wv** (ﾌﾞｰｲﾓ MMb6-brKf) · 2023/09/11(月) 16:18:12.03

＿_＿_＿_＿

**Moraler.M3wv** (ｱﾒ MM97-2F68) · 2023/09/11(月) 16:18:12.09

＿_＿_＿_＿

**Moraler.M3wv** (ｽﾌﾟｯｯ Sd5a-KNty) · 2023/09/11(月) 16:18:12.74

＿_＿_＿_＿

**Moraler.M3wv** (ﾌﾞﾓｰ MMe6-g7DH) · 2023/09/11(月) 16:18:12.75

＿_＿_＿_＿

**Moraler.M3wv** (ﾜｯﾁｮｲW b34a-4p9i) · 2023/09/11(月) 16:18:12.82

＿_＿_＿_＿

**Moraler.M3wv** (ｱﾒ MM97-9zOz) · 2023/09/11(月) 16:18:13.15

＿_＿_＿_＿

2023/09/11(月) 16:19:22.14

知らんけどどっちもベクトル計算はとくいなのでは

2023/09/11(月) 16:19:35.75

端的に言うと「金がないから」

2023/09/11(月) 16:19:43.23

2位じゃ駄目なんですか？

2023/09/11(月) 16:21:08.49

1000垓もポチポチ計算して意味ある？その力何に使うん？

2023/09/11(月) 16:21:54.10

富岳の実績を教えて

2023/09/11(月) 16:22:41.44

富岳貸してくれマイクラサーバ立てたい

2023/09/11(月) 16:23:01.89

答えになってないような

2023/09/11(月) 16:23:39.43

TSUBAME3.0で良いだろ

TSUBAME3.0 ハードウェア・ソフトウェア仕様
ttps://www.gsic.titech.ac.jp/sites/default/files/spec30j.pdf

2023/09/11(月) 16:24:03.46

アベシシステム？

2023/09/11(月) 16:25:11.44

富士通ヤシ

2023/09/11(月) 16:25:15.35

17分の1の能力しかないけど、17倍以上専有出来るから富岳でやるっていう
そのうち根性論とか温かみみたいなのにすり替わるぞ笑

2023/09/11(月) 16:25:31.61

中抜き

2023/09/11(月) 16:26:52.18

あきらめてNVIDIAかAMDからGPU買えよ
大量に

世界最速のスーパーコンピューターは
EPYCとRadeon instinctの組み合わせだぞ

2023/09/11(月) 16:28:17.64

富岳を使うことそれが大日本の埃

2023/09/11(月) 16:29:09.09

申請書に富嶽って書いとけば予算貰えるから

2023/09/11(月) 16:30:30.50

ビルゲイツ物語もそうだろ
一カ月に使えるキャパ使っちゃって
目でピーナッツ噛むことになった

2023/09/11(月) 16:30:54.14

偉い人がGPUでやった方が効率良いって知らないだけだけだと思う
で、
決まった事はもう止められずGPUの無いスパコンでLLM研究する不毛な研究

2023/09/11(月) 16:31:21.37

CA2LA
@ca2la1218
日本でGPT-4を作ろうとするとスパコン富岳を使って9年かかるらしい
それを90日で学習させたOpenAIはNVIDIAのGPU A100を25000基…

2023/09/11(月) 16:31:28.42

個別で動くから？

2023/09/11(月) 16:32:17.21

一度偉い人が決めたら方針添加なんて出来ない

2023/09/11(月) 16:32:46.45

>>88
すげえな金でブン殴るやつ

2023/09/11(月) 16:32:49.06

どう考えてもgpu使ったほうが効率的だよね
ガラパゴス富嶽で作っても誰もついてこないだろ

2023/09/11(月) 16:33:30.96

もうNVDIAが追い抜こうってのにおめでたいな

2023/09/11(月) 16:34:27.44

金かけたら早いなんて理想論語るのケンモメンらしいなあ()

2023/09/11(月) 16:34:28.59

高々17倍程度の性能差なら使えるリソースを使うってのは悪い考えでは無い
そんなに富嶽が空いてるんならね

2023/09/11(月) 16:34:30.42

できるなら良いでしょ
計算は結果なんですよ

2023/09/11(月) 16:34:54.82

アベコインのせいでGPU高すぎてもう買えねってはっきり言えよ

2023/09/11(月) 16:35:01.22

富岳がゴミなことバレない為に有効活用する方法を模索してるんだろ
大和と一緒で沈む運命だよ

2023/09/11(月) 16:35:05.77

もう後戻りはできない

2023/09/11(月) 16:35:07.92

>>93
また世界最強vs日本の富嶽ですか()

2023/09/11(月) 16:35:42.39

Chainerとかやってたけど、日本以外はどこも使わず
結局PyTorchを使うことになって、やったことが全部無駄になったという悲しい歴史もある

2023/09/11(月) 16:35:45.44

>>98
あーあ叩きたいだけ論

2023/09/11(月) 16:37:16.96

富嶽をあと２０台作れば勝てる

2023/09/11(月) 16:37:45.91

これ要は富岳が使われてなくてリソース余ってますってだけじゃん
全然ポジティブな理由じゃないし、記事にするような内容か？

2023/09/11(月) 16:38:12.50

計算回数でいきなりAIの性能上がるのおもろいな
何かの壁を突破した感じなんだろな

2023/09/11(月) 16:38:54.04

富岳はAIだけじゃなくて科学技術計算にも使うんだから倍精度偏重になるのは仕方ない
AI専門で設計されたGPUファームと比べるのは酷だろう

2023/09/11(月) 16:39:54.22

一般人は富岳でコロナウイルス飛散シミュレーションのゴミCGニュースしか目にしてない
もっと宣伝した方がいいんじゃないの

2023/09/11(月) 16:40:19.26

呪術廻戦の黒閃みたいやな
10の23乗って

2023/09/11(月) 16:41:05.43

？？？「出来ない理由を考えるのではなく」
？？？「無理というのはですね」

2023/09/11(月) 16:43:01.17

h100買ってくればいいやん

2023/09/11(月) 16:43:18.29

富嶽には飛沫計算があるから

2023/09/11(月) 16:44:27.31

性能的に後追いなモデルなうえライブラリが成熟してるGPUを使わないで富嶽用のソフトをシコシコ書きながらやるとなるとやったところで何が得られるのみたいな
まあ次期スパコンのアーキテクチャの参考にはなるのか

2023/09/11(月) 16:45:09.12

>>71
それはNECの方
富岳はNECが抜けて死んだプロジェクト

2023/09/11(月) 16:47:43.81

もっとPCに金かければAPEXで勝てたのに！ガキの言い訳じゃん
あるもんでやらなきゃ

2023/09/11(月) 16:49:40.55

この記事は富士通が絡んでいるから何が何でも富岳を使えって指示なのだろうな
まともな研究者なら逃げてる

2023/09/11(月) 16:50:02.24

>>103
富岳のCPUは15万個あるから富岳の1万分の1のCPU常時使えればいいだけでは
まあ4000分の1を1日1時間でも1週7時間でもなんでもいいかもしれん

2023/09/11(月) 16:51:04.90

>>116
4000分の1じゃなくて400分の1

2023/09/11(月) 16:51:24.19

AI用にもう一台作ればいい

2023/09/11(月) 16:51:39.69

ABCIシステムは予約がいっぱい入ってて現実的に長期で使えない
でも富嶽は長期に渡って貸切出来ます😤
　
って事？
なんで富嶽は予定が空いてるの？

2023/09/11(月) 16:52:12.06

世界の潮流が深層学習に向かってるの読めずにそれ用の環境用意できてないのが敗北
いや別に流行りにのっかれてればいいってもんでもないけどLLMに向いてないのに
本来の性能活かせる分野じゃないところへ計算資源投入してるのが敗北宣言

2023/09/11(月) 16:54:03.79

>>117
違うか
ABCIシステムの何分の1が富岳のCPU1個にあたるかを考慮しないとダメだな

2023/09/11(月) 16:54:21.82

>>88
9年ってあんたｗ
9年も経ったらもう海外のどこかでAGIが完成しているんじゃないか

2023/09/11(月) 17:00:32.10

そもそもcudaないとどうにもならんよね

2023/09/11(月) 17:01:54.42

ニューラルネットワーク研究の黎明期

アメリカの大学
「これ学習に演算量相当必要なんやなぁ・・・　当たったらデカそう？　じゃあメインフレーム優先的に使ってええよ」

日本の大学
「これ学習に演算量相当必要なんやなぁ・・・　絶対当たる研究とちゃうやろ？　じゃあ自前のDOS/Vで頑張りや」

2023/09/11(月) 17:02:26.18

アボガドロ数が6.02✕10^23
分かりやすいから23乗って言ったのかな

AIで金稼ぎしたい企業が超大規模GPUクラスタ作ればええやん感
こんなもん普通の学問向けの研究費の一部としてカウントしたら
他の分野の金を減らす名目に使われるだけなんだから

2023/09/11(月) 17:02:59.44

>>88
まあ富岳の建造費(1300億円)でA100が２５０００個(700億円)以上は買えるんだけどね
お金と工数のかけかた間違ってるな

2023/09/11(月) 17:03:33.38

>>124
別のスレでは選択と集中を叩いてそう

2023/09/11(月) 17:03:57.38

llmでタンパク質合成でもするか？

2023/09/11(月) 17:05:33.49

(今更やめられないという結論になった)

2023/09/11(月) 17:11:22.36

他に使い道なくて余ってんのか

2023/09/11(月) 17:12:04.64

富岳を使うということが目的なので海外から買えというのは受け入れられない

2023/09/11(月) 17:13:32.52

使う人間がうんこだとゴミだというのがマスクで立証されたな

2023/09/11(月) 17:15:16.33

ガイアの夜明けで特集してたけど意味不明な応答返してたな
日本発の生成AI作るならしょうがないんだろうけど富嶽で勝ち目があるのかがよくわからんわ

2023/09/11(月) 17:18:53.42

>>126
蓮舫の言う通り2位でも良かった
富嶽とか言うゴミを持ち上げたせいで他にリソース（資金と研究者）を使えずアメリカに負けた

自民と官僚を盲信して「政府の決めたことに文句言うな！」って煩いアホどもは、優先順位の概念を一生理解出来てないんだろうな

2023/09/11(月) 17:19:58.92

富嶽の得意なことってどんな計算なの？

2023/09/11(月) 17:23:15.35

H100買えばいいのに
それかテスラの道場みたいなAI学習専用のスパコン作るか

2023/09/11(月) 17:24:17.09

単純に「GPU＝ゲームに使うもの」ってイメージで使わないだけだろ

2023/09/11(月) 17:29:00.17

理研が新しくAI用スパコン開発してる

2023/09/11(月) 17:29:53.62

10の23乗FLOPsて絶対間違ってるだろ
他所が1秒間に出来る事を10日掛けてやる気なの？

2023/09/11(月) 17:32:29.29

ハードの前にまず学術的になんかしたい事あるのか？
日本はLLM分野じゃ論文引用も皆無の完全な空気だそうじゃない

2023/09/11(月) 17:35:52.35

富岳があいてるから
ってことか

2023/09/11(月) 17:36:11.29

半導体高騰の買い負けでAI用のスパコンを構築する金がないだけだろ
まさに国力の低下だわ

2023/09/11(月) 17:37:32.37

>>126
ではA100が２５０００個を屏風から出してください