【AI】Googleの内部文書が流出「オープンソースには勝てない」「Metaが勝者になる」「OpenAIは大したことない」 [742473609]

?2BP(2000) · 2023/05/08(月) 16:27:07.68

「オープンソースは脅威」「勝者はMeta」「OpenAIは重要ではない」などと記されたGoogleのAI関連内部文書が流出

2022年から2023年にかけて、OpenAIが「GPT-4」を、Metaが「LLaMA」を、Stability AIが「StableLM」を発表するなど、大規模言語モデル(LLM)の開発競争が1年間で激化しました。同様に大規模言語モデルの「LaMDA」を開発してしのぎを削ろうとするGoogleが、競合他社を分析し、オープンソースの脅威について詳細を記した内部資料が、Discordの公開サーバーから流出しました。

対話型AIの知名度を爆発的に高めた「ChatGPT」を開発するOpenAIは、対話型AIの分野で頂点に立っているとも分析できますが、Googleは「GoogleおよびOpenAIは次の軍拡競争に勝てる立場にない」としています。Google、OpenAI、Metaなどの企業がシェアを巡って争う中、一人勝ちするのは「オープンソース」だというのがGoogleの分析です。

2023年3月、前月にMetaが発表したばかりの大規模言語モデル「LLaMA」のデータが突如としてインターネット上に流出し、誰でもダウンロード可能な状態になりました。この出来事についてGoogleは「コミュニティは自分たちが与えられたものの重要性をすぐに理解しました。この後、革新的な技術が次々と生み出され、1ヶ月が経過した頃にはさまざまなアイデアが積み重なっていました」と述べ、重要なモデルが人々の手に渡ったことにより開発速度が爆発的に上昇したことを指摘しています。

さらに、LLaMA-65Bの登場からほどなくして、LLaMAをしのぐほどの性能を誇るオープンソースの大規模言語モデル「Vicuna-13B」が公開されました。このモデルはChatGPTでのやり取りやプロンプトをシェアできる拡張機能「ShareGPT」のデータに基づき、LLaMAのベースモデルを微調整することにより高品質なパフォーマンスを実現したもの。各種対話型AIの応答品質評価では、ChatGPTを100％とした場合、LLaMAが68％、Alpaca 7Bが76％だった一方でVicuna-13Bの品質は92％に迫っていることが分かっています。

こうしたオープンソースの大規模言語モデルが登場したことについて、Googleは「私たちのモデルは品質という点ではまだ若干の優位性を持っていますが、その差は驚くほど早く縮まっています。オープンソースのモデルは、より速く、よりカスタマイズ可能で、よりプライベートで、1ポンド当たりの性能は優れています。私たちが1000万ドルと5400億のパラメーターでなんとかやっていけているところを、Vicuna-13Bは100ドルと130億のパラメーターでやってのけているのです。しかも、数カ月ではなく、数週間でやってのけました。このことは、私たちにとっても大きな意味を持ちます」と指摘。

さらに「低コストで一般の人々の参加を可能にしたことで、大手企業の追随を許さない勢いを伴い、世界中の個人や組織からアイデア出しと反復が活発に行われるようになりました。オープンソースの最近の成功を後押ししたイノベーションは、私たちが今も苦労している問題を直接解決します。彼らの仕事にもっと注意を払うことで、車輪の再発明を避けることができます」と続けました。

続く

https://gigazine.net/news/20230508-google-document-llm-arms-race/

?2BP(1000) · NG

続き

モデルがオープンソースとして公開されたことによる効果は特に画像生成の分野で顕著であり、いち早くオープンなモデルを採用したStable Diffusionは、そうしなかったDall-Eとは異なり、製品の統合やマーケットプレイス、ユーザーインターフェースなどの革新的な技術が生まれました。

オープンソースの脅威に加え、わずかなコストで効率的に言語モデルを扱えるようにする調整機能「LoRA」についてもGoogleは「無視するべきではない」と危惧しています。Googleは「この技術はGoogleの最も野心的なプロジェクトに直接影響を与えるにもかかわらず、Google内部で十分に活用されていません。LoRAのアップデートは、最も一般的なモデルサイズで非常に安く作成することができます。つまり、アイデアさえあれば誰でもアップデートを作成し、配布することができるのです。これらのモデルによる改善のペースは、私たちの最大のバリエーションでできることを大きく上回っており、最高のものはすでにChatGPTとほとんど見分けがつかないほどになっています。地球上で最も大きなモデルを維持することに集中することは、実は私たちを不利な立場に追いやることになります。オープンソースと直接競合するのは敗者の提案です」と指摘しました。

自社技術を秘密にするか、オープンにするかはGoogleにとって常につきまとう命題だったそうですが、LLMでの最先端の研究が手頃な価格で受けられるようになった昨今、テクノロジーにおける競争優位性を維持することはさらに難しくなっています。自分たちの秘密を固く守るという選択もできる一方で、互いに学び合うこともできる「オープンソース化の選択肢を採るか否か」という現状をGoogleは勘案している様子。

自社のモデルが流出してしまったMetaについて、Googleは「逆説的ですが、この中で明らかに勝者なのはMetaです」と指摘。これは、流出はしてしまったものの、オープンソースのイノベーションのほとんどはMetaのアーキテクチャの上で起こっているので、Metaがその技術を直接自社の製品に取り入れることが可能なため。

競合となるOpenAIについては、Googleは「オープンソースに対する姿勢においてGoogleと同じ間違いを犯している」とし、「Googleがオープンソースの選択肢を取ることで、OpenAIが姿勢を変えない限り、先手を打つことができます」と主張。こうした事例からも、Googleは「オープンソースコミュニティのリーダーとしての地位を確立し、議論を無視するのではなく、協力することで主導権を握るべきです」という意思を示しました。

2023/05/08(月) 16:27:57.54

メメタァ大勝利だ

2023/05/08(月) 16:28:55.42

google無能すぎじゃね？

2023/05/08(月) 16:29:07.51

全部外してて草

2023/05/08(月) 16:29:33.62

グーグルの予想は過去にも結構外してるし今後も外すんだろうな
サービス終了と新規サービスの質が全てを物語っている
なのでグーグルの予想は気にするだけ無駄って事さ

2023/05/08(月) 16:31:05.30

いや、Googleは反日パヨク的だから嫌いだけど
さすがにGAFAMから脱落したMetaよりは上だろ

2023/05/08(月) 16:31:06.96

アホだけど内部で留めた上にMETAに乗っからなかったから賢いんだよ
予想はどうあれ勝ち馬に乗れば良いだけの話なんだから

2023/05/08(月) 16:31:27.79

バカすぎわろた

2023/05/08(月) 16:32:25.93

Vicuna-13Bでスケールではなくチューニングが重用ということがわかった
オープンソースが脅威というのは正解

2023/05/08(月) 16:32:42.91

ケンモメンってまじでスレタイしか読まないんだな

2023/05/08(月) 16:33:18.00

23年3月のレポートなら
自社の過大評価はともかくとしても
他は妥当だろ

2023/05/08(月) 16:33:19.35

LoRAがコスパいいとは言えベースのモデルは一般人じゃ作れないからな
大企業が作ったモデルありきなところは変わらなくね

2023/05/08(月) 16:34:25.10

確かに実際にオープンソースになった方は発展してるよな

2023/05/08(月) 16:35:19.16

オープンソースが天下取るってあんま想像できないんだよな
一般人がオープンソースの言語モデル導入とかできるわけないから何かしらの企業挟むんだろうけどそこにgoogleは入れないのか？

2023/05/08(月) 16:35:31.55

この記事から分かるのは
GoogleはStable Diffusion(それに付随するLoRa)をベタ褒めしてるんだな
面白い考察

2023/05/08(月) 16:36:03.88

オープンソースは強いな。

でもGoogleとOpenAIを並べてるのがなんとも

2023/05/08(月) 16:36:04.76

オープンソースはどうやってもデータが足りないだろ

2023/05/08(月) 16:36:12.19

Google完全に読み違えてて草

2023/05/08(月) 16:36:16.87

>>1
【60】名無しさん＠おーぷん：2023/05/08(月) 17:48:35.21 ID:xyz123

この内部文書の流出、本当に興味深いね。オープンソースは言語モデルの分野で着実に地位を築いているし、企業も無視できない存在になっているのがわかる。GoogleやOpenAIがオープンソースにどう対応していくか、これからの動きが楽しみだ。

また、Googleが指摘しているように、互いに学び合いながら進化することが大事だと思う。オープンソースは独占を防ぎ、イノベーションの速度を上げる可能性がある。企業も協力しながら、お互いに切磋琢磨することで、より良い技術が生まれると思うよ。

Google、Meta、OpenAIなどがどう競争し合い、オープンソースの勢いにどう対応していくのか、今後の展開が非常に気になる。

2023/05/08(月) 16:36:17.31

ボランティアで参加する人ってモチベはなんなわけ？

2023/05/08(月) 16:36:24.56

>>13
そのコスパ良い発想が出てくるのもオープンにしたからだっていう前提のもとの話だと思うよ

2023/05/08(月) 16:37:26.84

>>18
皆が参加するからデータ増えるんじゃないの？

2023/05/08(月) 16:37:36.14

独占させないのは良い事だよマジで

2023/05/08(月) 16:37:40.33

>>21
会社じゃ好きなもの作らせてくれない

2023/05/08(月) 16:37:49.13

まあ自社のAIがあのザマじゃな

2023/05/08(月) 16:38:14.81

メタってそんな凄いんだ

2023/05/08(月) 16:39:43.50

>>15
そこで重要になるのが

>私たちが1000万ドルと5400億のパラメーターでなんとかやっていけているところを、Vicuna-13Bは100ドルと130億のパラメーターでやってのけているのです。

の部分
軽くそして高品質な発想が出れば一般人の手元(つまりエッジ環境)で一般人のコストの範囲で使えるようになる

2023/05/08(月) 16:40:05.79

最近のAIの論文だいたいPyTorchで実装してるし
metaが一番AIの発展に貢献してんだよな

2023/05/08(月) 16:40:14.74

AIにAIモデル学習させて新しいAI作ればよくね

2023/05/08(月) 16:42:09.88

>>30
それがソースにあるVicunaってやつじゃないのん？

2023/05/08(月) 16:42:36.44

>>22
俺の認識が違ってるかもだけどそもそも汎用AIを作りたくて大量なデータを食わせてAI作るのと何かの目的に特化させてチューニングしたAI作るのは目的が違くない？
データ食わせる時代は終わって今後はチューニングだけでやっていけるっていうのから話は変わるけど

2023/05/08(月) 16:45:03.18

だったらはよやれや

2023/05/08(月) 16:46:13.38

>>31
ネタで書いたけどもう実現してたのか
すげぇなAI

2023/05/08(月) 16:46:16.78

Googleの天才達とやらも、未来予測はまるで下手くそなんだな

2023/05/08(月) 16:47:36.11

24GB版の3090の中古買っとけ
Vicuna-13Bで
PCでGPT-4に近い環境が動くようになるぞ

2023/05/08(月) 16:48:46.88

>>32
そのチューニングの積み上げと集積によって全体のモデルが改善されるのではという方向の話だと思うよ

書いてて思ったけど確かにこれなら大量なデータを食わせてモデルを作るという時代は一応終わったと見てもいいかもしれない

2023/05/08(月) 16:49:40.37

metaはreactの守護者ではあるから本格的に死なれたら困るんだよな

2023/05/08(月) 16:50:34.58

ワイはテキストではシコれないからGPTはいらねぇな

2023/05/08(月) 16:52:49.47

おまえらもVicuna-13b使ってみ？
無料で無制限だから
そしたらGoogleが言ってることがよくわかるよ
スレタイは全部当たってると思うね

2023/05/08(月) 16:53:16.78

アンドロイドってオープンソースなんじゃなかったっけ？
そのモデル真似できんのか？

2023/05/08(月) 16:54:42.76

いまのAI開発に1番投資して来たのは間違いなくGoogle
その次は以外だけどFB時代からずっとMeta
これまでのAI開発はこの2社が引っ張ってた
それが約5年まえからOpenAIが加わり
去年のGPT3.5以降言語生成でリードし
他のGAFAMも5年前の同じ時期から高額投資を始めて今に至る

今 MetaのLLaMAを使えば近いうちに
ワークステーションクラスの
ローカルPCで言語生成が当たり前になる
そうなると今のChatGPT4も電気喰いの高価なおもちゃに成りかねない

2023/05/08(月) 16:57:39.05

やばいな全然言葉について行けてない
もうオッサンだ

2023/05/08(月) 16:59:25.85

なんでこれで読み違えてるみたいな話になってるの？

2023/05/08(月) 17:00:03.44

大本営じゃん

2023/05/08(月) 17:00:09.94

ガバガバな分析、現状認識だな…
こういう見解が集まって世界はなんとなくそれなりに動いてるんだな

2023/05/08(月) 17:00:17.63

>>37
ここで出てるVicunaもChatGPTありきだしそれに近付けはするだろうけど超える方法は現状ないよな
確かにVicunaのベース自体はGPT4未満のはずだし学習データさえあれば良くなるってことなのかな

2023/05/08(月) 17:01:29.58

>>37
いや大量データ食わせないと意味ないという時代が始まった

2023/05/08(月) 17:03:32.43

そこまで分かってるならBardもっと賢くしてよ🥺

2023/05/08(月) 17:06:56.98

>>49
莫大なカネがかかる上にオープンソースとの競争で勝てないのが見えたからもうモチベがなくなってても不思議じゃない

2023/05/08(月) 17:06:59.90

無料のbing,拡張機能のGPT open aiの一人勝ち

2023/05/08(月) 17:07:33.14

Google「いかがでしたか？」

2023/05/08(月) 17:07:56.42

結構真面目にメタバースに特攻したんだな
ネタで死んでるかと思ってたわ

2023/05/08(月) 17:08:54.14

重要な観点はaiを使ってどうやって儲けるか
その点で、word、excelみたいなビジネスオフィスソフトと、azureみたいなインフラサービス両方持ってるmsが有利
msはaiにいくらでも投資できる、回収する見込みあるから
facebookはaiに投資しても回収する見込みない

2023/05/08(月) 17:10:50.49

オープンソースって派生が生まれるだけじゃね？

2023/05/08(月) 17:11:49.86

>metaが勝者

meta株ジャンピングキャッチした馬鹿社員がわざと流してるだろこれ

2023/05/08(月) 17:15:09.67

>>54
AI技術がふんだんに使われる世界になるはずだった肝心のメタバースが盛大にコケて🤯ってなってそう

2023/05/08(月) 17:15:42.96

>>40
知らんから調べたら
メモリの必要量がエグいな

ただ一般人でもボーナスぶち込めば揃う価格で動くってのはすごいな

2023/05/08(月) 17:19:09.10

今Metaに期待寄せてるの誰がいんだよ
飛ばし記事じゃねーか

2023/05/08(月) 17:19:34.83

OpenAIと提携してるMSが勝者じゃないの

2023/05/08(月) 17:19:43.79

AIから他のAIの情報を学習すればいいんでね

2023/05/08(月) 17:22:42.68

言ってることはわからなくはないけどオープンにした結果犯罪に使われまくるだろうなこれ

2023/05/08(月) 17:22:57.94

流出したプログラムはどこにあるの

2023/05/08(月) 17:25:53.12

オープンソースでAI開発してる人らって何者なんだ？
クソ頭いいんだろうな

2023/05/08(月) 17:30:25.82

Metaが勝者というのはモデルが流出したけど優れたオープンソースの成果を取り込めるというのが理由だぞ
最終的な勝者とまでは言っていない

＞自社のモデルが流出してしまったMetaについて、Googleは「逆説的ですが、この中で明らかに勝者なのはMetaです」と指摘。これは、流出はしてしまったものの、オープンソースのイノベーションのほとんどはMetaのアーキテクチャの上で起こっているので、Metaがその技術を直接自社の製品に取り入れることが可能なため。

2023/05/08(月) 17:31:08.24

もしかしてAIって井崎脩五郎クラスの頭なの

2023/05/08(月) 17:32:01.36

メモリー60GB必要なのか

2023/05/08(月) 17:34:59.48

AI全然たいしたことないじゃん
いつになったらドラえもんを作れるんだい🤔
失望しかない

2023/05/08(月) 17:35:36.43

Googleのトランスフォーマーのおかげで
MSのopen AIがgptを開発して
このオープンソースのVicuna-13Bは
メタのLLaMAをベースに
GPTの会話データで微調整だろ
オープンソースって言っても
結局ビッグテックありきじゃないの？

2023/05/08(月) 17:37:18.85

これってお手元のデータ分析用に良さそう。
やはり、まだまだ世の中走り続けているな。

2023/05/08(月) 17:39:13.72

>>69
ほんまこれ
KubernatesもそうだけどGoogleは技術提唱はするけどその後のマネタイズが全然できてないんだよな
でもその提唱するだけの要素技術を見つけられるのはさすGoogleやと思うわ

2023/05/08(月) 17:44:53.44

>>71
技術が先進的すぎて、マネタイズするところまで
もっていけていないんだな。あるいは広告ビジネスが
あまりにもイージーなのか。

もっとも暫く経つと、マネタイズするための簡単な
仕組みを今の技術をベースに作ってしまうのかも
しれない。今の Google の広告ビジネスだって、
何も無いところから作り上げてしまっているわけだし。

2023/05/08(月) 17:47:29.65

Googleも落ちぶれたな

2023/05/08(月) 17:52:39.70

あらゆるデータセットや計算リソースを一番持ってそうなGoogle様がいまいちリード出来ない理由がよくわからんな

2023/05/08(月) 17:52:54.34

買収すれば良いだけ

2023/05/08(月) 18:01:38.11

犯人はAbe

2023/05/08(月) 18:03:48.58

オープンソースとはいえまだゲーミングPCとかで動かすのは難しいらしいから
研究者意外だとLLaMAとかはまだ一部の物好きが動かして遊んでる程度の印象
もう少し要求スペック下がったらStableDiffusionみたいにいっきに広がりそうなのにな

2023/05/08(月) 18:04:12.41

無能

2023/05/08(月) 18:06:08.40

>>74
それは5年前までの話
Transformerが発表されて振り出しに戻った
しかもGoogleは同じ5年前に経営側と研究者が
AI開発方針で衝突して大量離脱を招いたのが
今の体たらくに陥った最大の理由
しかも皮肉なのは
残った研究者と経営側がAI利用で
厳しい倫理規定を定めてしまった為
人工知能開発に足枷が出来てしまってた

2023/05/08(月) 18:09:50.65

metaが勝者は(ヾﾉ･∀･`)ﾅｲﾅｲ

2023/05/08(月) 18:17:42.99

だからMetaのオープンウエア使えば
OpenAIにライセンス料払わないで済む場合
研究開発でどちらが普及ると思う？と言う話

2023/05/08(月) 18:18:52.02

でもFirefoxは無様に負けたよね

2023/05/08(月) 18:18:59.46

おれも
OPen
Place
AI
通称OPPAI開発しようかな

2023/05/08(月) 18:22:11.39

それも言うならChromiumだよ

2023/05/08(月) 18:28:30.79

現状だと間違いなくChatGPTとBingAIが一番性能がいいと思う
だが今後は本当にどうなるか分からないなGoogle関係者の言うとおりだと思う
気になるのはAIの開発には信頼できる大規模データが欠かせないみたいな事をAIは言っていたけどオープンソースはこの問題はどうするんだろうな

2023/05/08(月) 18:47:24.44

メモリ60ギガも乗せてる人いなくね

2023/05/08(月) 18:53:05.69

重要な開発物が簡単に流出するようなMetaに信用がおけるわけないだろ
それに外部で独自進化しちまったら如何にベースアーキテクチャが同じだろうともう簡単には取り込めんよ

2023/05/08(月) 19:29:18.94

イーロン・マスクがこのチャンスを逃す訳が無いよな
あいつのAIも短期間に台頭してきそう

2023/05/08(月) 19:36:17.27

やっぱりLinuxだね

2023/05/08(月) 19:49:18.02

>>74
チャット系が世間でバズったからずっと開発を続けてきたOpenAIが独走して他が追ってるように見えるけど、AI全般で見ればデータも計算リソースも先進的な研究もグーグルが先行してるよ
元々やる気がなかったチャットサービスを英語限定とはいえ半年たらずでそれなりに調整した状態で公開したのも驚異的なスピードだし

2023/05/08(月) 19:50:40.58

Metaは去年から世界最速級の
AIトレーニング用スパコンが稼働し出してるから
今まさにライバルと同じように
巨大データーを使った大規模言語モデルを訓練してる最中

2023/05/08(月) 19:57:02.82

利用者のデータが必須なら利用者に対価を払う仕組み作るしかないんじゃない
まあ利用してもらうだけ赤字だからそれも無理か

2023/05/08(月) 20:41:29.14

>>88
Tesla社もAIトレーニング用最新スパコンを持ってる

2023/05/08(月) 20:45:39.76

TensorFlowはPyTorchに負けたもんな
くだらないメタバースやめたら追い上げてくるかも

2023/05/08(月) 20:48:24.39

トンチンカンな分析やな
メタなんて沈むだけだろ

2023/05/08(月) 20:49:37.96

>>85
openAIのCEOは大規模なデータを使う時代はもう終わりみたいなこと言ってたよ

2023/05/08(月) 20:53:56.53

Linuxちゃん！

2023/05/08(月) 20:56:04.13

みんながよってたかって改良するオープンソースには勝てないもんな

2023/05/08(月) 21:00:22.55

なんかAIに作ってもらった文章のようだな

2023/05/08(月) 21:06:03.70

Metaが勝つとか言っちゃったのか
マジでGoogle終わってるな

2023/05/08(月) 21:24:33.37

Google「やべぇOpenAIに追いつ行けねぇ。悔しいからmetaの勝ちってことにしとくか！」
meta「？！」

2023/05/08(月) 21:31:25.83

>>91
Metaは去年「大規模スパコン開発中です」「世界最速級になる予定です」って大々的に発表したわりにその後いつものようにそれっきりだけどちゃんと稼働開始できたのあれ

2023/05/08(月) 21:40:40.67

>>102
Metaは金出しただけで開発したのはNvidiaだけどね
絶賛稼働中

2023/05/08(月) 21:43:44.69

>>98
それは００年代の幻想だったよね、というのが長年ネットウォッチしてたオジサンの感想

2023/05/08(月) 21:50:13.91

>>103
なるほどありがとう

>>104
結局どこかで足踏み状態に陥るよねオープンソース

2023/05/08(月) 22:26:55.80

MetaはGPUメインで大規模言語モデルを処理できる様になったって、前出てたからな
一回50円もコストかかってるOpenAIは負けると思うよ
新しい解決策出してきたらまた変わるけど

2023/05/09(火) 01:51:41.14

検索にAIを使うようになったら
「ググる」の代わりに何て言うようになるのか