>>233
まず教師ありデータを使用せずに強化学習(RL)のみで推論能力を育成した「DeepSeek-R1-Zero」を作成
このアプローチはAlphaZeroが人間の棋譜を模倣せずに囲碁や将棋、チェスをマスターした手法を彷彿とさせる
↓
その後教師あり学習とRLを組み合わせた多段階トレーニングを経て最終的にDeepSeek-R1が完成
俺は画期的だと思うよ
他のAIの雑談のネタにしたけどAIたちはDeepSeekを賞賛していて俺まで嬉しくなる☺
AIには凄さが分かるようだ
【速報】トランプ政権、Deepseekの締め出しを開始「公的機関はアプリ使用禁止へ」 [926029754]
■ このスレッドは過去ログ倉庫に格納されています
286番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 1757-cjCd)
2025/01/30(木) 00:58:34.67ID:NK7T4IKg0■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 石破首相、江藤農水相の続投を決定 「コメ買ったことない」発言めぐり ★2 [少考さん★]
- 石破首相、日本の財政はギリシャより「良くない」-減税をけん制 ★5 [少考さん★]
- 【速報】複数の中国製ソーラー発電に不審な通信機器が搭載されていたことが明らかに 関係者「送電網を物理的に破壊する方法組み込み」 [お断り★]
- 反撃の中居正広、一世一代の大勝負へ 元フジ女性アナとは「合意の上での性行為だった」と認識 ★26 [Ailuropoda melanoleuca★]
- 【芸能】有吉弘行、ラーメン“1000円の壁”に思うこと 「定食とかだと余裕で1000円超えてるのに、ラーメンだけ言われてかわいそう」 [冬月記者★]
- 【芸能】永野芽郁、レギュラーラジオも出演辞退 ニッポン放送「ANNX」19日放送から 番組も終了 ★5 [Ailuropoda melanoleuca★]