【AI】ChatGPTの回答を入力する数万人のインド人「グロやポルノも多い、耐えられない」 [125197727]
■ このスレッドは過去ログ倉庫に格納されています
「AI(人工知能)」の能力を向上させる開発手法として知られる機械学習。だが、実際に誰がどうやってAIを学習させているかを公にしている企業は少ない。
米紙の記者が大手IT企業からAIの学習作業を受注するインド企業を取材。その仕事内容や労働環境は、「最先端技術」や「希望のある未来」とはかけ離れたものだった。
こうした人力作業に対し、大手IT企業は沈黙を貫く。作業を通じて大量の個人データを他企業と共有していることにに対する批判の声も、日増しに高まっている。
2019年本紙はシリコンバレーの「魔法使いたち」がめったに首を縦に振らないその“内幕”を垣間見ることができた。インド国内のほか訪問した拠点すべてで、人間がひたすら反復作業を繰り返してはAIを学習させていた。いずれも「アイ・メリット(iMerit)」という会社の事業所だ。
だが、事業所で目にしたのはおよそ未来とは思えない光景だった。少なくとも「自動化」「ハイテク」という言葉から連想される職場ではない。作業者が閲覧する画像のなかには、ポルノや斬首画像などの暴力的なものも含まれる。プラダンと同僚たちの賃金は、月額150~200ドルの間だという。
彼らの職場はコールセンターか、支払い処理業務センターのようだった。そのうちのひとつが、かつての賃貸集合住宅でいまはプラダンが働いているブバネーシュワルの古いビルだった。歩行者に三輪タクシー、露天商でごった返す低所得層の居住区にそれは建っていた。
ブバネーシュワルで見たようなAIの学習拠点は、中国、ネパール、フィリピン、東アフリカ、アメリカにあり、数万人の社員が毎日タイムカードを打刻してAIの学習に励んでいる。
加えて、さらに数万人もの個人ワーカーが在宅で業務を請け負い、「アマゾン・メカニカル・ターク(Mturk)」のようなクラウドソーシングサービスを介してデータのラベル付け作業をおこなっている。
メカニカル・タークでは誰もが雑用をアメリカ内外の個人事業者に発注でき、ワーカーはラベル付け業務1件につき数セントを受け取る。
研究者らは、AIの学習データ量をもっと少なくしたいと考えている。だがそれが実現するまでの間は、人間の労力が不可欠だ。
「これはテクノロジーの影に隠れ、いまなお拡大し続けるもう“ひとつの世界”です。このループから労働者を解放するのは困難です」と、マイクロソフトの人類学研究者メアリー・グレイは指摘する。
https://courrier.jp/news/archives/194519/ え、人力なの!?
最初のプログラマーが起動したら完全に自己学習する自立AIだと信じてたんだけど 入力していないはずのベンガル語がAIで使える理由わかっちゃった お前だったのか…
女児を頭からミキサーに突っ込むホラー小説を書いてたのは… aiは現実世界の倫理がわからない
そのためにこの作業がいる
こんなことをしてるよりもカメラつけたAIを人間と一緒に生活させた方が早いんじゃねーの?がトレンド 自動販売機の中に人が入ってるのは常識だろ( ^)o(^ ) 一番最初はそうかもしれないけど、今のAIはもう画像認識出来るし要らんだろ >>15
認識した内容が正解かどうかを教える人が必要 これは画像のアノテーションの話で最初から正解ラベルのある自然言語とは違うだろ 正確な出力を得ようとすると人手のラベリングは必須だからな 全文は読めないけどこの話は2019年のものらしいし
今もこういうやり方「も」やってるにしてもOpenGPTの学習にはもっと機械化されたものもあるんじゃないの?
人力通してたらそう簡単に学習スピード上がらんだろ chatGPTは20人だっけか? 正解データを教えるテスターの数 2019とかまだ敵対性ネットワークもないような時代だからな GPTの回答に対して間違いを指摘してるユーザーはインド人と同類って事ね
AI言う割には画像認証の闇と同じパターンか >>26
今はもう変わってると思うけど安倍の死因を訊いた
彼は存命中です冒涜しないでくださいって言われたから
ソース聞いたら2019年のデータだった 俺がアンアン喘がせていたのはインド人虐待だったのかすまん 人が中に入って人工知能かよ
ロボGみたいな仕組みだな 嫁と間男が不倫した話ばっかりしてごめんな
いつも励ましてくれてありがとう 世界中のチャット型AIはどれも
とんでもない数の人間フィルタリングで選別し
用意した兆単位の文章を
建屋丸ごとのGPU演算スパコンで
何ヶ月も大電力で機械学習演算して
出来たLLMを使って
ユーザーの質問や命令に対して
その度に推論演算を行なって答えてる
それでも精度は推論演算する限り
理論上ゼロにはならないのがネック なお萌え絵は欧米のチー牛たちが勝手にタグ付けしていた模様 MTurkでお小遣い稼ぎしようとしたことあるけど、日本じゃ登録承認されないんだよな >>2-3
こういうのがイーロン・マスクの「宇宙の真理を解き明かすAI」みたいなのに騙されちゃうんだな
人間が宇宙の真理を理解しなきゃAIだって理解できねえよ
AIは何が正しいかなんて知らないんだから タグ付けみたいなのか
そこらあたりの判断こそがAIの真髄ののにな
言葉だけ並べても戯言にしかならんか >>1
ソースに無いChatGPTをスレタイにする目的は何? AI(笑)に夢見過ぎ
人力で選別したデータを流し込んでるのが実態で自律的に思考しているわけではない そう考えるとただでポルノとグロにタグが付いてく仕組みのhentai画像サイトって神のようなデータソースだな 学習には教師データが必要
これは業界では当たり前の話 >>2
自動販売機の中には人が入ってるって知ってたか? 想定問題に対して人が用意した回答を返してるだけって事は…人工無脳の発展型って事ねw
皆んな騙されたわけだ🤪 >>9
これやってみたけど、ネガティブ表現は拒否られた
代わりに面白いこと言ってと書いたら
文字あふればっかでたこ焼きラーメンカレーと食い物の話ばかり
AIも腹減るんだな 来年あたりから自動学習するようになりそう
そうなるとこいつらは使い捨てやな >>46
chatGPTの話はこっちやね
open AIが有害データのラベリングにケニア人を時給2ドルで働かせたタイムの記事( ´ ▽ ` )ノ
Exclusive: OpenAI Used Kenyan Workers on Less Than $2 Per Hour to Make ChatGPT Less Toxic
https://time.com/6247678/openai-chatgpt-kenya-workers/ これは初期だけで、途中から自己学習するんだよな?? 原発がでかい湯沸かし器と知った時のようながっかり感 ■ このスレッドは過去ログ倉庫に格納されています