生成AIの進歩、終わる。OpenAIが報道機関から訴えられ1記事当たり2000万円の賠償金請求 [261484327]
■ このスレッドは過去ログ倉庫に格納されています
New York Times紙がサービス利用規約(TOS)を更新し、AI企業がAIモデルを訓練するために記事や画像をスクレイピングすることを禁止していることが明らかになったが、どうやら事態はそれだけでは収まらないようだ。
New York Times紙はOpenAIを提訴する準備を進めており、その結果次第ではChatGPTのデータセットは再構築を余儀なくされ、侵害コンテンツ1つにつき最高15万ドルの罰金が科されるなど、OpenAIに壊滅的な打撃を与える可能性があると専門家は推測している。
NPRが、この件に関して“直接知っている”2人の人物に話を聞いたところ、NYTの弁護士は、同紙の報道の “知的財産権を守るために”訴訟が必要かどうか熟考していることを確認しているという。
もしNYTがChatGPTの製造元であるOpenAIを訴えた場合、その訴訟はChatGPTの爆発的な人気以来、著作権保護をめぐる「最も注目される」法廷闘争になる可能性があるとNPRは示唆した。この憶測は、Sarah Silverman氏が他の人気作家たちと共に、自分の本の著作権保護を求め、同様の懸念からOpenAIを提訴した1ヶ月後のことである。
NPRは、NYT紙が同社のコンテンツの違法コピーを証明することに成功し、裁判所がOpenAIのトレーニングモデルに明示的に許可されたデータのみを含めるよう制限した場合、OpenAIが連邦裁判官からChatGPTのデータセット全体の完全な再構築を命じられる危険性があると報じている。OpenAIは侵害コンテンツ1つ1つに対して巨額の罰金を科される可能性があり、OpenAIに金銭的な大打撃を与えることになる。それ以上に、法的勝利は、他の権利者からの同様の請求の雪崩を引き起こす可能性がある。
OpenAIの学習モデルから自分の本を削除するオプションを保持することを最も懸念しているように見える著者とは異なり、NYT紙はChatGPTのようなAIツールについて他の懸念を持っている。NPRは、ChatGPTがNYTのコンテンツを利用して、”競争相手”になる可能性があることを “最大の懸念 “として報じている。
今月現在、NYTのサービス利用規約は、”機械学習や人工知能(AI)システムのトレーニングを含むがこれに限定されない、あらゆるソフトウェアプログラムの開発”のためにコンテンツを使用することを禁止している。
NPRの報道によると、このメディアはOpenAIとのライセンス契約を再考しているようだ。このライセンス契約は、OpenAIがそのモデルのトレーニングに使用したNYTのコンテンツに対する対価を支払うことを保証するものだった。NPRによると、OpenAIとTimesの間のミーティングは “論争的”になっており、Timesはライセンス契約に参加する価値があるかどうかを検討しているようだ。
AIトレーニングモデルを守るために、OpenAIはChatGPTのようなツールをトレーニングするために吸い上げたすべてのWebコンテンツの「公正使用」を主張しなければならないだろう。NYTのケースで言えば、ChatGPTの回答を作成するためにTimesのコンテンツをコピーしてもTimesと競合しないことを証明することになる。
専門家たちはNPRに、それはOpenAIにとって挑戦的なことだと語った。というのも、2015年に連邦著作権法違反で勝訴したGoogle Books(書籍の抜粋が実際の書籍の「重要な市場代替物」を生み出さなかったため)とは異なり、ChatGPTは一部のWebユーザーにとって、報道のソースとしてNYTのWebサイトに実際に取って代わる可能性があるからだ。
NPRの報道によると、NYTの首脳陣は6月、このリスクをいち早く警告したかのようなメモを職員に出したという。メモの中で、Times紙のAlexHardimanン最高製品責任者(CPO)とSam Dolnick副編集長は、会社にとって一番の「恐れ」は、生成AIツールから「我々の権利を守ること」だと述べている。
「生成AIを使用する企業が、当社の知的財産、ブランド、読者との関係、投資を尊重するようにするにはどうすればよいか」と生成AIの利点とリスクを検討し始めているニュースルームで提起されている疑問と呼応している。
先月、AP通信はOpenAIとライセンス契約を結んだ最初の報道機関のひとつとなったが、契約条件は明らかにされていない。そして本日、AP通信は、他の報道機関と共に、ニュースルームにおけるAI利用の標準を開発したと報告した。
https://texal.jp/2023/08/18/openai-may-have-to-erase-and-rebuild-chatgpt/ 学習させるデータさえあれば良い結果を得られることを示せた
著作権切れのデータや自作データ、契約したを使えば良いだけ これ本当にジャップの独り勝ち有り得そうだな
ジャップサイトは英語じゃなくて日本語だしジャップだけAIの恩恵受けられる 絵柄のコピーも機械学習で簡単にできちゃうけど、やってることは完全に盗作だからね >>6
絵柄に著作権なんてないから的外れ
著作権で何が保護されてるか勉強して出直しておいで んーこりゃ無理だろ
仮に止められたとしても一時しのぎにしかならん >>3
ジャップが世界最悪の表現の無法地帯であることが功を奏すときが来たな 有料記事を盗まれたわけじゃないのなら先読み出来なかっただけ 原理的に著作権侵害にはならない
コピーしてるわけではないから ニュース報道の文章は
文法的に正しい、内容的に正しい
理想的な教師データだもんな
ニュース報道がアウトなら
5chのレスを教師データにしてみてはいかが? 自然言語処理の研究にニュースのテキスト使ったら駄目なんて話になったらこの分野全体が崩壊するよ
大昔から新聞の記事を文字起こししたやつを構文解析してデータベースにしてたんだから >>12
著作権法違反かはどうか分からんけど
ニュース報道サイトを最初に開いたときに
サービス規約をACCEPTさせる仕組みで
その規約違反ってのが論旨でしょ 将来的にAIがニュースサイトに取って代わる可能性は大いにあるが、現状のchatGPTがニュースの代替になるとか無理筋すぎるだろ
ニュースみたくてchatGPTもしくはその派生サービス開くやつなんていねーよ >>15
ログインせず自由にみられるウェブサイトでその規約ってどこまで有効なんだろうね
robot.txtとかも紳士協定みたいなもんらしいし
スクレイピング禁止サイトでスクレイピングしたらなんかの法にひっかかる? 当たり前だろそんなん
Wikiテキスト使っての学習なんてほんの一部でほとんどがWebクロールだからな 規約を好きに主張するのは勝手だし、要求された方が大人しく従えば丸く収まるけど
「いやその規約はおかしいだろ」と裁判を起こせば規約の方が覆るようなこともある
「駐車禁止罰金○万円」とかも明示してあってもあまり非常識な額だと減額されたりとか Googleニュースでも同じ様な事例で負けたんだから
当然争っても負けるんだよな。
データ使いたければ使用料払うしかないよな。 >>18
そのあたりはこの裁判結果次第でしょ
スクレイピング禁止サイトのスクレイピングは個人で使う分にはばれないでしょ >>25
中国は文言や思想に関して厳しいから
chat系は・・・ ワシントンタイムズを学習させて世界を平和に統一しよう 考えてみればエロ同人誌なんてどう考えても違法なのに
大手の企業がネットで平気で売ってるんだもんな
こんな著作権が緩い国なんて世界にないだろう まさかのジャップラ勝利や
ジーク自民!ハイルあべぴょん!ありがとう著作権法30条の4! Google metaも訴えられまくったけど逆に脅迫してなかったか 正規新聞社のテキストデーターは
どっかのコタツ記事じゃなく
実際に記者が取材してまとめた
相当コストのかかってるものだから
学習と言う形でも二次利用しchatGPT内で
学習や引用される限り使用料払うしかないよ
あとは和解して使用料安くして貰うしかない AIの生成物の由来を解析するAIソフト作れば大儲け出来そうだな これ2chニュー速でかつてあった問題と同じじゃね
記事のテキストを無断転載するなって >>35
一緒だね
結局丸々全文コピペ利用はダメだけど
引用はOKとか、ニュースサイトの言い分が全部通るような法律では無いんだよね
まとめサイトとかも同様 こんな裁判判決出るのに何年もかかるやろ
その間にAIが発展して「今更止められないということになった」にならんか 大量のデータで事前に学習っていう力業が主流みたいだけど
なんかもっとランタイムで学習フィードバック繰り返していくようなスマートなやつとかは研究されてないの 画像生成AIの方は訴えを棄却されてたよな
こっちも同じ結末になるだろ😂 てかこれがアウトなら人間がニュースサイトみるのもアウトにならね?
その知識でなにもアウトプットしないなんてこと不可能だし OpenAIは調子に乗ってMinecraftの会社買収したりしてるらしいからな
こんな反社企業は今のうちに潰しておくべき これビッグデータの時に似てるね
そこに許諾が必要ってなるだけでおそらくどこのサイトもこんな利用は許さないとなるだろうけども ■ このスレッドは過去ログ倉庫に格納されています