【悲報】メタ、AI学習のためにTorrentを通じて81テラバイトのデータを違法ダウソしていたことが裁判資料を通じて明かされる [386328734]
■ このスレッドは過去ログ倉庫に格納されています
Meta社が、Anna's Archiveを通じて大量のデータをダウンロードしていたことが、新たに公開された裁判文書で明らかになった。Meta社がBitTorrentを使用していたことは以前から知られていたが、今回の文書では、具体的なデータソース、ダウンロード量(81.7テラバイト以上)、およびシードの少なさやダウンロード速度の遅さといった苦労が内部メールのやり取りから明らかになった。
著者らによるMeta社に対する著作権侵害訴訟の中で、原告側はMeta社がLibGenなどから著作権侵害にあたる書籍を大量にダウンロードしたと主張している。Meta社は、BitTorrentの使用は法的に問題があると認識していたものの、Anna's Archiveなどを通じて大量のデータを取得していた。
Meta社の従業員の中には、著作権侵害の可能性を懸念する者もいたが、Meta社はFacebookのインフラをTorrentに使用することのリスクについても議論していた。しかし、Meta社は著作権侵害を否定しており、AIモデルの学習データとしての利用は、アメリカの著作権法上のフェアユースにあたると主張している。
学習データを不正調達ってまあ当たり前の話だからな
DeepSeekだけが言われるような話ではない
>>9 deep seekがかけられてる疑いは「OpenAIの出力そのまま学習しやがったな!」でしかないから
何法にも違反しない
AIの出力は著作物じゃない
Facebook Researchの画像生成やOCRの論文に、
「競合よりでかいデータセットを用意しました」とは言ってくるけど調達の経緯は解説してしてくれないやつあったからな
しかしTorrent経由だったとは
絶対違法なブツだろ
ロリが違法なことを学習させる為にアウロリを落としてたかもしれないな
初期のAIって無料DLの方法教えてくれたけど
教えてくれなくなったよなw
セコすぎるw
フェアユースで何でもOKなのがアメリカ人の論理だろ?
問題ないやん
ヤンルカンもAI学習はフェアユース!って叫んでたな
まぁポジショントークか
毎度思うんだけど
今のAI学習って手法的に質の低いデータ入れたら質の低いAIができるんだが
それで良いの?
論文データベースだけ学習させれば良くね
>>28 質の低い人間には質の低い回答
質の高い人間には質の高い回答してるだろ
>>28 LibGenがまさにそれなんだけど
論文がすべて無料だと思ってるのか
>>31 メタなら普通にエルぜビアとネイチャー系の全アクセス買えるでしょ
なぜ営利企業が無料縛りに?
>>33 ほとんどの庶民が求めているのは論文データじゃないから
ここには1人でこの数倍割ってる奴いるだろ
コンテンツを楽しむためではなく割れが目的になってる奴がな
>>33 それやるとバレるからじゃない?
>>33 だからケチったから今こうやって糾弾されてる話なんだが、
理解力低過ぎない?
ちゃんと全部買ってデータ集めてたらこうやって叩かれてないんだよ
この世の全ての情報を平均した言わば偏差値50の知能って
自然知能であれ人工知能であれそいつに質問を聞く意味無いと思うが
さらに言うとネットで大量の情報作ってるのは我々のような頭のおかしな連中だから
もっと悲惨なレベルだろ
無意味なデータの学習AIって作る意味がよく分からんな
フェアユースだから何でもダウンロードwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
■ このスレッドは過去ログ倉庫に格納されています