お前らのmixi日記が生成AI用の学習データとして陽の目を見るかもしれない [434496575]
■ このスレッドは過去ログ倉庫に格納されています
こんにちは。あたしはカウガール。
AAとして成り上がるため、スレを巡る旅をしています。
__
ヽ|__|ノ モォ
||‘‐‘||レ _)_, ―‐ 、
/(Y (ヽ_ /・ ヽ  ̄ヽ
∠_ゝ ` ^ヽ ノ.::::::__( ノヽ
_/ヽ /ヽ ̄ ̄/ヽ
[ニューヨーク 5日 ロイター] - 2000年代初頭、フォトバケットは世界一の画像管理・共有サイトだった。当時人気だったマイスペースやフレンドスターといったサービスのメディア管理を担うバックボーンとして7000万人ものユーザーを抱え、米国のオンライン写真市場の半分近くのシェアを握っていた。
現在、フォトバケットを使い続けているユーザーはわずか200万人にまで激減し、スタッフ数も40人程度となった。しかし、生成AI(人工知能)革命のおかげで、フォトバケットは「第2のピーク」を迎えようとしている。
コロラド州エドワーズを本拠とする同社のテッド・レナード最高経営責任者(CEO)はロイターの取材に対し、文章による指示に応じて新たなコンテンツを生み出す生成AIの学習に、フォトバケットが持つ130億点の写真と動画の利用を認める件で、複数のテクノロジー企業と交渉中だと明かした。
交渉中のレートは写真1点あたり5セントから1ドル(約152円)、動画は1本あたり1ドル以上だという。買い手や希望する画像の種類に応じて価格には大きな幅がある。
「交渉相手の企業は、もっとたくさん必要だと言う」とレナードCEOは語る。ある買い手からは、10億本以上の動画がほしいと言われた。フォトバケットでは賄いきれない量だ。
「それだけの量をどこで確保しようというのか」
フォトバケットでは、これまで報じられていなかったこの交渉の相手企業について、営業秘密だとして具体名を明かさなかった。だが交渉が行われているという事実からは、フォトバケットが抱えるコンテンツが数十億ドルもの価値を生む可能性だけでなく、生成AI技術をめぐる覇権競争のもとでデータ市場が活況を呈していることがうかがわれる。
グーグル(GOOGL.O)
, opens new tabやメタ(META.O), opens new tab、マイクロソフト(MSFT.O)
, opens new tab傘下のオープンAIといったテクノロジー大手は、対話型AI「チャットGPT」などの生成AIモデルを訓練するために、インターネット上を流れる大量のデータを無料で収集してきた。各社はこうした「スクレーピング」について合法で倫理的だと主張してきたが、これに対して著作権者が次々に訴訟を起こしているのが現状だ。
その一方で、テクノロジー大手は、「有料の壁」やログイン画面の背後にあるコンテンツを密かに買い集めている。チャットのログからとっくに忘れていた個人的な写真に至るまで、廃れたソーシャルメディア上に残るあらゆるものが陰で取引されるようになっている。
法律事務所クラリス・ローのエドワード・クラリス氏は、「今まさに、スクレーピングできない非公開コンテンツを持っている著作権者の奪い合いが生じている」と語る。クラリス・ローでは、写真や動画、書籍のアーカイブについてAI学習のためにライセンス供与する1件数千万ドル規模の交渉について、コンテンツ所有者の相談に応じているという。
ロイターでは、関連企業の現・元幹部、弁護士やコンサルタントなど30人以上に話を聞き、この誕生まもない市場について取材した。購入されるコンテンツの種類、合意された価格相場、さらには本人への通知や同意取得がないまま個人データがAIモデルに流出するリスクをめぐって浮上している懸念などについて、詳細な情報を得た。
オープンAIやグーグル、メタ、マイクロソフト、アップル、アマゾンは、いずれもこの記事のために具体的なデータ交渉や協議についてコメントすることを控えてた。グーグルは、データプライバシー保護に関する行動規範を示し、違反が発見されれば、「最悪の場合はサプライヤーとの契約破棄も含め、即座に対応する」と述べた。 IDすら分からなくなってるが10年以上前のおれの日記どうなってるんだろう 5chもその素質はあったろうにスクリプトやら荒らしのおかげで大半は除外も厄介なゴミデータが混じった産廃の集まりにしかなってないという皮肉 ■ このスレッドは過去ログ倉庫に格納されています