X



「AIの学習データが底をつく」'2026年問題'の衝撃度とその対策とは? [577316145]
■ このスレッドは過去ログ倉庫に格納されています
0001番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 6787-wasR)
垢版 |
2023/07/24(月) 07:26:03.23ID:SPaZKMwc0?2BP(2919)

「AIの学習データが底をつく」――'2026年問題'が、改めて注目を集めている。

AI研究の第一人者の1人、カリフォルニア大学バークレー校教授のスチュアート・ラッセル氏が、国連のAIサミットでこの問題を指摘した。

チャットGPTのような大規模言語モデル(LLM)の開発には、膨大な学習データが必要だ。

主な収集元はネットだが、使えそうなデータは徐々に使い尽くされ、良質なデータは2026年には底をつくと見られている。

ツイッターは7月初め、利用回数の制限を実施し騒動となった。その引き金になったのも、AIの学習データ収集のためのアクセス集中だったという。

「大きいことはいいことだ」という大規模言語モデルの開発に、壁が立ちふさがっている。


●「レンガの壁にぶつかる」

|"個人的には、大規模言語モデルをどんどん大きくして、より多くのデータで学習させるという根本的なやり方が終わりに近づいており、レンガの壁にぶつかり始めていると思う。これらのシステムを学習させるだけのテキストは、世界中で文字通り底をつき始めている。"

カリフォルニア大学バークレー校教授のスチュアート・ラッセル氏は、国連の専門機関、国際電気通信連合(ITU)が7月6、7両日にジュネーブで開催したイベント「AI・フォー・グッド・グローバル・サミット」に出席。8日に公開されたインタビュー動画で、今後7年の展望を問われ、こう答えた。

米ビジネスサイト、インサイダーが報じている。

ラッセル氏は、AIの教科書の定番とされる共著『エージェントアプローチ 人工知能』や近著『AI新生 人間互換の知能をつくる』などで知られるAI研究の第一人者の1人。

「AIのゴッドファーザー」の1人、モントリオール大学教授のヨシュア・ベンジオ氏やイーロン・マスク氏、アップル共同創業者のスティーブ・ウォズニアック氏らとともに、「GPT-4を超えるAIの半年間の開発停止」を求める大規模署名も先導した。

ラッセル氏はその中で、「私が見た予測では、そのデータ量は人類がこれまで書いたすべての書籍に匹敵する」とも述べている。

情報サイト「ハウスタッフワークス」の推計によると、人類がこれまで書いた本は1億5,626万4,880タイトルに上るという。

さらに、言葉のやりとりに関わる人間の仕事の多くがAIに取って代わられるだろう、との見通しも示し、こう言う。

|"AIには人間的な心はない。AIはいわば、'人間もどき'のようなものだと思う。AIは巨大だが底が浅く、奇妙に人間とは違う。我々は、ほんの数か月で何十億もの'人間もどき'の知的存在を、世界に加えてきたのだ。"

●2026年の「枯渇」

|"我々の予測では、低品質の言語データは2030年から2050年までに、高品質の言語データは2026年までに、視覚データは2030年から2060年までに、ストックを使い果たすだろう。これによって、機械学習(ML)の進歩は減速するかもしれない。"

AI研究グループ「エポック」は2022年11月10日に、こんな予測を発表した。オープンAIがチャットGPTを公開する20日前のことだ。

高品質言語データとはウィキペディアやニュース記事、科学論文など、主に編集作業を伴うコンテンツを指す。これに対して低品質言語データとは、ツイッター投稿などの、編集がおこなわれていないテキストを指す。

「エポック」の見通しでは、大規模言語モデルの品質に影響すると言われる高品質言語データは、今から3年後の2026年には枯渇。低品質の言語データも早ければその4年後の2030年には枯渇するのだという。

ただし、データ学習の効...

詳細はサイトで
https://news.yahoo.co.jp/byline/kazuhirotaira/20230724-00359127
0002番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW e7dd-MP9x)
垢版 |
2023/07/24(月) 07:26:17.23ID:WT/OfQ0v0
------
0003番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW e7dd-41Th)
垢版 |
2023/07/24(月) 07:26:18.01ID:WT/OfQ0v0
------
0004番組の途中ですがアフィサイトへの転載は禁止です (クスマテ MM4f-TKj/)
垢版 |
2023/07/24(月) 07:26:18.54ID:pokI4OT4M
------
0005番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW e7dd-UpwF)
垢版 |
2023/07/24(月) 07:26:18.63ID:WT/OfQ0v0
------
0006番組の途中ですがアフィサイトへの転載は禁止です (アメ MMeb-KBDL)
垢版 |
2023/07/24(月) 07:26:19.28ID:wz7UoG+7M
------
0007番組の途中ですがアフィサイトへの転載は禁止です (クスマテ MM4f-c+o+)
垢版 |
2023/07/24(月) 07:26:19.55ID:pokI4OT4M
------
0008番組の途中ですがアフィサイトへの転載は禁止です (ドナドナー MM8f-0xdg)
垢版 |
2023/07/24(月) 07:26:20.03ID:WaKYkJObM
------
0009番組の途中ですがアフィサイトへの転載は禁止です (アメ MMeb-gfnF)
垢版 |
2023/07/24(月) 07:26:20.09ID:wz7UoG+7M
------
0010番組の途中ですがアフィサイトへの転載は禁止です (クスマテ MM4f-Omna)
垢版 |
2023/07/24(月) 07:26:20.53ID:pokI4OT4M
------
0011番組の途中ですがアフィサイトへの転載は禁止です (アメ MMeb-ubtO)
垢版 |
2023/07/24(月) 07:26:20.96ID:wz7UoG+7M
------
0012番組の途中ですがアフィサイトへの転載は禁止です (ドナドナー MM8f-mqnn)
垢版 |
2023/07/24(月) 07:26:21.42ID:WaKYkJObM
------
0013番組の途中ですがアフィサイトへの転載は禁止です (ドナドナー MM8f-eNWH)
垢版 |
2023/07/24(月) 07:26:22.54ID:WaKYkJObM
------
0014番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW e7a1-jbqh)
垢版 |
2023/07/24(月) 07:26:22.70ID:UOW7vKTS0
------
0015番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW e7a1-wKe/)
垢版 |
2023/07/24(月) 07:26:23.40ID:UOW7vKTS0
------
0016番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW e7a1-UWB6)
垢版 |
2023/07/24(月) 07:26:24.02ID:UOW7vKTS0
------
0017番組の途中ですがアフィサイトへの転載は禁止です (クスマテ MM9f-JE3L)
垢版 |
2023/07/24(月) 07:26:24.92ID:o2jwngsdM
------
0018番組の途中ですがアフィサイトへの転載は禁止です (アメ MMeb-Rtg+)
垢版 |
2023/07/24(月) 07:26:25.44ID:8Hv7BdKXM
------
0019番組の途中ですがアフィサイトへの転載は禁止です (クスマテ MM9f-DW5z)
垢版 |
2023/07/24(月) 07:26:25.91ID:o2jwngsdM
------
0020番組の途中ですがアフィサイトへの転載は禁止です (アメ MMeb-q363)
垢版 |
2023/07/24(月) 07:26:26.28ID:8Hv7BdKXM
------
0021番組の途中ですがアフィサイトへの転載は禁止です (クスマテ MM9f-1XnL)
垢版 |
2023/07/24(月) 07:26:26.89ID:o2jwngsdM
------
0024番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 0742-UQg9)
垢版 |
2023/07/24(月) 07:30:59.73ID:DOoPJdyd0
2025年に一気に高齢者が増える
そのときがターニングポイント
0026番組の途中ですがアフィサイトへの転載は禁止です (スップ Sd7f-xJh2)
垢版 |
2023/07/24(月) 07:31:52.99ID:/wzySTqId
AIって嘘ばっかりで自信満々に答えてくるけど
そんなAIの作った記事で溢れかえったネット記事を更に学習してポンコツになったりせんの?
0027番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 7fdc-QKh6)
垢版 |
2023/07/24(月) 07:32:32.19ID:vFna9v1R0
いや、データはもう要らんだろ
10年前のコーパスでも十分使い物になるし
それよりAIそのものを改良する方が大事
0028番組の途中ですがアフィサイトへの転載は禁止です (スプープ Sd7f-0sQ5)
垢版 |
2023/07/24(月) 07:33:35.74ID:yZ7qVA1Jd
もう食い尽くしたのか
ネットの世界は広大じゃなかったのか
0029番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 67af-UQg9)
垢版 |
2023/07/24(月) 07:34:03.19ID:AoH7XFs60
取捨選択ができないとガイジになってしまう
0031番組の途中ですがアフィサイトへの転載は禁止です (ブーイモ MMff-N9Pf)
垢版 |
2023/07/24(月) 07:35:16.60ID:l2U4CEGTM
AIが自分で作った情報を評価して学習出来るようにならないとな
まぁなんなら評価の部分は人力でも良いと思うけど
0032番組の途中ですがアフィサイトへの転載は禁止です (テテンテンテン MM8f-7Biw)
垢版 |
2023/07/24(月) 07:35:19.47ID:qVZeCT92M
もうすでにAIにデータセット作らせ始めてるから
AIが自分でデータセット作って学習するようになるよ
0035番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 4795-9iWY)
垢版 |
2023/07/24(月) 07:38:12.27ID:tTkuIXaL0
絵もテキストも動画から自動で書き起こせよ
そしたら毎日無限に供給され続けるだろ
0036番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 7fdc-QKh6)
垢版 |
2023/07/24(月) 07:39:02.77ID:vFna9v1R0
>>26
嘘じゃなくて質問に対してその先に続く可能性が一番高い文章がそれってだけ
AIに本当のこと言わせたいなら別で正しいことが確認された情報のデータベース用意するべき
0039番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW a7af-sUEC)
垢版 |
2023/07/24(月) 07:46:28.48ID:/Bg0eQnm0
文字はあらゆる言語の完全翻訳が一応の到達じゃないの
データは人間が写真やら観測結果を入れ続けないと
0041番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW e7ea-/dWn)
垢版 |
2023/07/24(月) 07:48:18.05ID:lH2+2NI50
AIが自分で創作して学習しなかったら、何のためのAIだよ
人工無能かよ
0042番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 67af-7GGs)
垢版 |
2023/07/24(月) 07:49:05.17ID:JrkdnCBk0
嫌儲のスクリプト書き込みから学習してええよ
0043番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 67af-UQg9)
垢版 |
2023/07/24(月) 07:49:26.55ID:AoH7XFs60
ロクに翻訳もできずハゲも治せないのにテクノロジーはデカいことばかり言う
0045番組の途中ですがアフィサイトへの転載は禁止です (スッップ Sdff-Lpsr)
垢版 |
2023/07/24(月) 07:53:43.64ID:0iU0IxU2d
将棋みたいにシンプルな正解があれば独学に意味があるがそうでないものはAIでは判断がつかない
0046番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 5fb4-Vt0O)
垢版 |
2023/07/24(月) 07:54:35.58ID:jeja1T3y0
淫夢のデータもちゃんと学習しろよ
0047番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 07d1-bxGm)
垢版 |
2023/07/24(月) 07:54:36.85ID:pwMg6wch0
嫌儲というネットの知の集合体があるだろ
0048番組の途中ですがアフィサイトへの転載は禁止です (テテンテンテン MM8f-+JbK)
垢版 |
2023/07/24(月) 07:55:16.99ID:w5XG7deUM
AIとAIが嫌儲でスレ立てしてレスバして人間がそれを眺める
これが新しい嫌儲
0051番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 5f87-Cu97)
垢版 |
2023/07/24(月) 08:04:08.24ID:5/649Ghv0
一度抜いたオカズでは抜けないってこと?
0052番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 7f9f-DHa7)
垢版 |
2023/07/24(月) 08:04:37.39ID:snyj66OO0
広告見てる人にカネ払え

AIの素材になってる人にカネ払え
0053番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW a786-iICO)
垢版 |
2023/07/24(月) 08:05:26.18ID:8oH687/P0
これChatGPTの元アルゴリズムを開発したサイエンティストが指摘した、AIの生成データ氾濫による虚偽情報の跳梁跋扈の別側面の問題だね
0056番組の途中ですがアフィサイトへの転載は禁止です (ブモー MMcf-16Sq)
垢版 |
2023/07/24(月) 08:08:37.31ID:cWo8zfUmM
動画を一コマ一コマ学習してないし話し言葉をすべて学習していない
杞憂
0057番組の途中ですがアフィサイトへの転載は禁止です (クスマテ MM9f-nlc0)
垢版 |
2023/07/24(月) 08:10:26.09ID:vKcw2bPjM
AI画像生成は学習先を取捨選択して絵のレベルを上げてるから
そんな風にして賢くしていくんじゃないのか
0060番組の途中ですがアフィサイトへの転載は禁止です (スプッッ Sd7f-zLSm)
垢版 |
2023/07/24(月) 08:15:36.46ID:EZIQEjLkd
>>50
2001年宇宙の旅
0061番組の途中ですがアフィサイトへの転載は禁止です (アウアウウー Sa2b-dloa)
垢版 |
2023/07/24(月) 08:18:46.06ID:XxrHMYesa
人間ですら漫画家とかだんだん絵が変になっていくからな
0064番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 074d-ItAA)
垢版 |
2023/07/24(月) 08:23:00.51ID:qa9KbPWr0
AI制御のロボットにカメラとマイク載せて町に繰り出せばいいじゃない?
リアルタイムで人と会話して
0065番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW a786-iICO)
垢版 |
2023/07/24(月) 08:24:01.92ID:8oH687/P0
>>58
機構無しに規模だけで楽観的観測をするのは無責任な底辺の発言だね
0066番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW a786-iICO)
垢版 |
2023/07/24(月) 08:25:44.57ID:8oH687/P0
HowではなくMay beの話をするのがニセ科学批判クラスタの特徴
0067番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 5fcf-1AW6)
垢版 |
2023/07/24(月) 08:27:49.78ID:fV+YK8xP0
その内にAIが作り出したデータで埋まって
異常学習が始まるよ
0068番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 7f8f-Y9B7)
垢版 |
2023/07/24(月) 08:32:04.81ID:U4FJr7rm0
>>62
それらを誰がデータ化すんのよって話じゃないの
AIがこれ以上先に進むなら電子的な世界だけじゃなくて現実世界へのセンサーと直接繋げる必要が出てくんのかねえ
0071番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW dfa2-QLMQ)
垢版 |
2023/07/24(月) 08:40:15.18ID:5nh7DVe70
書籍や新聞紙を裁断して電子化する求人がはかどるな
暇をもて余してる中国の若者にやらせよう
0073番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ df56-SN+J)
垢版 |
2023/07/24(月) 08:50:19.73ID:hi3fdbd60
>>39
まず実直にこれを実現して欲しいもんだよな
これがさっさとできなきゃ他無理だろ
AIなんて単なる確率統計ってもうバレてんだから妄想や煽りはうんざりだわ
0074番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW df00-dNaF)
垢版 |
2023/07/24(月) 08:57:46.88ID:CV8TKXiT0
人間は大したデータ量に触れずに高度な学習が出来るけど
なにが違うんだろうな
0081番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 27d2-viHL)
垢版 |
2023/07/24(月) 09:46:11.71ID:fJd/PmKG0
人類が今まで掛かってやっと蓄えた知識としてのテキスト量が
このたった数年で教師データーとして消費され尽くして
やっと今のレベルなのにこれより先どうやって
今まで以上の「教師データー」を用意するのかw
人間が用意が間に合わなくなれば
機械自体に自己(経験)学習させる事が求められるけど
それは可能なのか仮にそれが可能だとして
それまで機械任せにするとどこまで人類が制御できるのか?
そろそろ壁が見えて来てるよね
0082番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW e7ea-/dWn)
垢版 |
2023/07/24(月) 09:46:48.72ID:lH2+2NI50
メタよりもARグラスだよね
0083番組の途中ですがアフィサイトへの転載は禁止です (JPW 0H0b-FR/N)
垢版 |
2023/07/24(月) 09:47:46.79ID:W5G1FjvCH
ソースはネットだからあんなアホなのか…
0084番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 67af-q7ML)
垢版 |
2023/07/24(月) 09:52:34.85ID:IC6fJccc0
十分だろ
0085番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ bf8b-Czog)
垢版 |
2023/07/24(月) 09:56:06.56ID:Y6bhpfwz0
データ入れれば入れるほど
どんどん頭悪くなっていく機械学習型AI
0086番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 7fdc-lz2y)
垢版 |
2023/07/24(月) 09:58:23.86ID:dxqifZK50
>>33
無計画人類ワロタ
0087番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 7f83-dMjp)
垢版 |
2023/07/24(月) 10:02:48.92ID:lc43H7zu0
>>33
そもそもAI学習でうまくいかない事なんて日常茶飯事なんだよ
あれこれ試行錯誤して出来上がったものを検証繰り返してこれで良しとなったらモデルの新バージョンにするというサイクル

駄目になるという方向の結論なんていくらでも誘導できるし
そのダメモデルなんて採用しなければ良いだけというのを言及しないのは、そういう世論誘導したいだけだな
0089番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 5f87-onGn)
垢版 |
2023/07/24(月) 10:25:41.51ID:9C7yAAQs0
たくさん勉強するだけでは賢くならない。ガリ勉が馬鹿であることが証明されたなw
0092番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 67af-6SeW)
垢版 |
2023/07/24(月) 11:07:11.08ID:Cg4pHfiP0
> 高品質言語データとはウィキペディアやニュース記事、科学論文など、主に編集作業を伴うコンテンツを指す。
> これに対して低品質言語データとは、ツイッター投稿などの、編集がおこなわれていないテキストを指す。
嫌儲と言うか5chはどちらかといえば低品質言語データのようだが、5chはまだ大雑把にジャンル分けされているから低品質の中でもまともなデータかもしれないな
0096番組の途中ですがアフィサイトへの転載は禁止です (バットンキン MMbf-Z4Lz)
垢版 |
2023/07/24(月) 11:32:51.56ID:4wb56WY6M
まあヤフーのゴシップ記事書いてるやつなんてこんなレベルかw

平和博
桜美林大学教授 ジャーナリスト
桜美林大学リベラルアーツ学群教授、ジャーナリスト。早稲田大卒業後、朝日新聞。シリコンバレー駐在、デジタルウオッチャー。2019年4月から現職
0097番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 6787-wasR)
垢版 |
2023/07/24(月) 11:59:53.32ID:SPaZKMwc0?2BP(2919)

嘘だと思ったなら指摘すれば良いし、自分の中で完結してるなら黙ってればよくねえか?
0102番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 7fad-mo7p)
垢版 |
2023/07/24(月) 13:46:54.80ID:pE0z4H5/0
進化は止まらないんだぁ~!!!
早くAI同士で学習しまくって新たなAI産ませろ
0105番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW df22-ucPs)
垢版 |
2023/07/24(月) 19:44:09.36ID:d6ryAwKc0
一般人がgpt4とか使いだしてまだ1年も経ってないだろ
来年再来年の進化が予測できんのかよ
0106番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ dfb2-UQg9)
垢版 |
2023/07/24(月) 20:01:21.66ID:+iEMnMi/0
結局HUMANには勝てん
0107番組の途中ですがアフィサイトへの転載は禁止です (テテンテンテン MM8f-pGuq)
垢版 |
2023/07/24(月) 20:25:45.94ID:xVoj892nM
要約、翻訳、ロールプレイは現時点でもかなりすごい
計算や知識を問うような使い方はどんなに品質上がっても完璧にはならんだろうな
0108番組の途中ですがアフィサイトへの転載は禁止です (スフッ Sdff-QKh6)
垢版 |
2023/07/24(月) 21:10:20.18ID:HtYmki2kd
AIに欠けてるのは記憶力
エピソード記憶ができるようになれば学習データなんか最低限の自然言語処理が出来るだけの量で十分
0109番組の途中ですがアフィサイトへの転載は禁止です (スップ Sdff-TLeN)
垢版 |
2023/07/24(月) 21:17:38.14ID:Pqmt9AWTd
>>78
盛りつけも含めたAI料理機は来ると思ってる
中華料理界やフランス料理界、ケーキ業界やパン業界がそれに耐えられるか
世界もだけど日本での影響は大きい
テレビのグルメ番組とか
0110番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 6714-G3Df)
垢版 |
2023/07/25(火) 06:54:34.26ID:8jrUqJHg0
少なくとも現状でネトウヨとかと話すよりは有益な会話が出来てる
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況