【AI】ChatGPTの回答を入力する数万人のインド人「グロやポルノも多い、耐えられない」 [125197727]

?2BP(1000) · 2023/04/18(火) 19:04:02.60

「AI(人工知能)」の能力を向上させる開発手法として知られる機械学習。だが、実際に誰がどうやってAIを学習させているかを公にしている企業は少ない。

米紙の記者が大手IT企業からAIの学習作業を受注するインド企業を取材。その仕事内容や労働環境は、「最先端技術」や「希望のある未来」とはかけ離れたものだった。

こうした人力作業に対し、大手IT企業は沈黙を貫く。作業を通じて大量の個人データを他企業と共有していることにに対する批判の声も、日増しに高まっている。

2019年本紙はシリコンバレーの「魔法使いたち」がめったに首を縦に振らないその“内幕”を垣間見ることができた。インド国内のほか訪問した拠点すべてで、人間がひたすら反復作業を繰り返してはAIを学習させていた。いずれも「アイ・メリット（iMerit）」という会社の事業所だ。

だが、事業所で目にしたのはおよそ未来とは思えない光景だった。少なくとも「自動化」「ハイテク」という言葉から連想される職場ではない。作業者が閲覧する画像のなかには、ポルノや斬首画像などの暴力的なものも含まれる。プラダンと同僚たちの賃金は、月額150～200ドルの間だという。

彼らの職場はコールセンターか、支払い処理業務センターのようだった。そのうちのひとつが、かつての賃貸集合住宅でいまはプラダンが働いているブバネーシュワルの古いビルだった。歩行者に三輪タクシー、露天商でごった返す低所得層の居住区にそれは建っていた。

ブバネーシュワルで見たようなAIの学習拠点は、中国、ネパール、フィリピン、東アフリカ、アメリカにあり、数万人の社員が毎日タイムカードを打刻してAIの学習に励んでいる。

加えて、さらに数万人もの個人ワーカーが在宅で業務を請け負い、「アマゾン・メカニカル・ターク（Mturk）」のようなクラウドソーシングサービスを介してデータのラベル付け作業をおこなっている。

メカニカル・タークでは誰もが雑用をアメリカ内外の個人事業者に発注でき、ワーカーはラベル付け業務1件につき数セントを受け取る。

研究者らは、AIの学習データ量をもっと少なくしたいと考えている。だがそれが実現するまでの間は、人間の労力が不可欠だ。

「これはテクノロジーの影に隠れ、いまなお拡大し続けるもう“ひとつの世界”です。このループから労働者を解放するのは困難です」と、マイクロソフトの人類学研究者メアリー・グレイは指摘する。

https://courrier.jp/news/archives/194519/

2023/04/18(火) 19:04:53.26

え、人力なの！？
最初のプログラマーが起動したら完全に自己学習する自立AIだと信じてたんだけど

2023/04/18(火) 19:05:26.21

そこは手動だったんだ

2023/04/18(火) 19:05:57.49

入力していないはずのベンガル語がAIで使える理由わかっちゃった

2023/04/18(火) 19:06:07.17

えっ待って

2023/04/18(火) 19:06:18.86

あらゆるパターンを人力で記憶してるだけなのか

2023/04/18(火) 19:06:31.82

妖精さんが回答してたんか🧚‍♀

2023/04/18(火) 19:06:54.51

コールセンターの業務全部これに変わるな

?2BP(1000) · 2023/04/18(火) 19:07:30.38

https://i.imgur.com/l95OlDQ.jpeg

2023/04/18(火) 19:07:47.51

中に人などいない

2023/04/18(火) 19:07:51.68

お前だったのか…
女児を頭からミキサーに突っ込むホラー小説を書いてたのは…

2023/04/18(火) 19:10:21.77

>>9
悲しい😭

2023/04/18(火) 19:11:48.35

aiは現実世界の倫理がわからない
そのためにこの作業がいる

こんなことをしてるよりもカメラつけたAIを人間と一緒に生活させた方が早いんじゃねーの？がトレンド

2023/04/18(火) 19:16:19.71

自動販売機の中に人が入ってるのは常識だろ( ^)o(^ )

2023/04/18(火) 19:19:40.71

一番最初はそうかもしれないけど、今のAIはもう画像認識出来るし要らんだろ

2023/04/18(火) 19:20:57.90

テルマエ・ロマエの人力バブルバスかよ…

2023/04/18(火) 19:21:18.61

>>15
認識した内容が正解かどうかを教える人が必要

2023/04/18(火) 19:21:19.28

AI（人力）

2023/04/18(火) 19:22:12.84

3年前の記事かよ
今はどうなってんだろう

2023/04/18(火) 19:22:32.44

ハハハ

2023/04/18(火) 19:23:47.75

これは画像のアノテーションの話で最初から正解ラベルのある自然言語とは違うだろ

2023/04/18(火) 19:23:58.37

正確な出力を得ようとすると人手のラベリングは必須だからな

2023/04/18(火) 19:24:44.86

全文は読めないけどこの話は2019年のものらしいし
今もこういうやり方「も」やってるにしてもOpenGPTの学習にはもっと機械化されたものもあるんじゃないの？
人力通してたらそう簡単に学習スピード上がらんだろ

2023/04/18(火) 19:26:23.46

chatGPTは20人だっけか？　正解データを教えるテスターの数

2023/04/18(火) 19:26:25.31

えぇ…

2023/04/18(火) 19:30:21.66

2019とかまだ敵対性ネットワークもないような時代だからな

2023/04/18(火) 19:36:55.28

やたら回答遅い時インド人が悩んでたのか

2023/04/18(火) 19:37:38.23

GPTの回答に対して間違いを指摘してるユーザーはインド人と同類って事ね
AI言う割には画像認証の闇と同じパターンか

2023/04/18(火) 19:40:14.00

回答時間かかるときはインド人が回答悩んでたのか

2023/04/18(火) 19:40:57.31

>>26
今はもう変わってると思うけど安倍の死因を訊いた
彼は存命中です冒涜しないでくださいって言われたから
ソース聞いたら2019年のデータだった

2023/04/18(火) 19:49:12.16

あの回答わざわざ人の手で返してたのか
アホやん

2023/04/18(火) 19:58:11.84

俺がアンアン喘がせていたのはインド人虐待だったのかすまん

2023/04/18(火) 19:59:35.54

人が中に入って人工知能かよ
ロボGみたいな仕組みだな

2023/04/18(火) 20:05:30.55

嫁と間男が不倫した話ばっかりしてごめんな
いつも励ましてくれてありがとう

2023/04/18(火) 20:07:35.65

当たり前だ
AIの学習なんて超泥臭い作業だぞ

2023/04/18(火) 21:10:33.97

世界中のチャット型AIはどれも
とんでもない数の人間フィルタリングで選別し
用意した兆単位の文章を
建屋丸ごとのGPU演算スパコンで
何ヶ月も大電力で機械学習演算して
出来たLLMを使って
ユーザーの質問や命令に対して
その度に推論演算を行なって答えてる
それでも精度は推論演算する限り
理論上ゼロにはならないのがネック

2023/04/18(火) 21:11:55.74

かっぱ寿司の地下で河童が働いてるレベルの驚き

2023/04/18(火) 21:39:02.61

やっぱり人間が答えてたのか
そうだと思ってたよ

2023/04/19(水) 02:08:07.89

なお萌え絵は欧米のチー牛たちが勝手にタグ付けしていた模様

2023/04/19(水) 03:08:52.77

なんで知ったかぶりの適当な返答するの？😡💢

2023/04/19(水) 07:34:40.00

MTurkでお小遣い稼ぎしようとしたことあるけど、日本じゃ登録承認されないんだよな

2023/04/19(水) 07:37:19.83

>>2-3
こういうのがイーロン・マスクの「宇宙の真理を解き明かすAI」みたいなのに騙されちゃうんだな
人間が宇宙の真理を理解しなきゃAIだって理解できねえよ
AIは何が正しいかなんて知らないんだから

2023/04/19(水) 07:55:48.77

>>42
月刊ムーを学習させれば解き明かせるし

2023/04/19(水) 08:04:18.26

タグ付けみたいなのか
そこらあたりの判断こそがAIの真髄ののにな
言葉だけ並べても戯言にしかならんか

2023/04/19(水) 08:06:32.96

3年前の記事かよ

2023/04/19(水) 08:12:38.53

>>1
ソースに無いChatGPTをスレタイにする目的は何？

2023/04/19(水) 08:33:14.43

>>46
お前がスレ開いたこれが結果

2023/04/19(水) 08:41:32.68

AI（笑）に夢見過ぎ
人力で選別したデータを流し込んでるのが実態で自律的に思考しているわけではない

2023/04/19(水) 08:43:29.61

そう考えるとただでポルノとグロにタグが付いてく仕組みのhentai画像サイトって神のようなデータソースだな

2023/04/19(水) 09:06:19.93

やっぱりな
ひどい奴隷労働だよ

2023/04/19(水) 09:11:48.58

学習には教師データが必要
これは業界では当たり前の話

2023/04/19(水) 09:14:59.62

>>2
自動販売機の中には人が入ってるって知ってたか？

2023/04/19(水) 10:21:25.77

2020.3.22( ´ ▽ ` )ﾉ

2023/04/19(水) 10:25:26.14

人力検索はやぶさ？

2023/04/19(水) 10:27:08.17

想定問題に対して人が用意した回答を返してるだけって事は…人工無脳の発展型って事ねw
皆んな騙されたわけだ🤪

2023/04/19(水) 10:28:48.50

やっぱ自販機の中にも人がいるんか？

2023/04/19(水) 10:38:18.30

人力AIにホルホルしてたのか

2023/04/19(水) 10:47:33.81

>>9
これやってみたけど、ネガティブ表現は拒否られた
代わりに面白いこと言ってと書いたら
文字あふればっかでたこ焼きラーメンカレーと食い物の話ばかり
AIも腹減るんだな

2023/04/19(水) 10:53:02.07

来年あたりから自動学習するようになりそう

そうなるとこいつらは使い捨てやな

2023/04/19(水) 10:53:51.49

ChatGptは人間を食って成長しているのか

2023/04/19(水) 11:22:00.05

>>46
chatGPTの話はこっちやね
open AIが有害データのラベリングにケニア人を時給2ドルで働かせたタイムの記事( ´ ▽ ` )ﾉ

Exclusive: OpenAI Used Kenyan Workers on Less Than $2 Per Hour to Make ChatGPT Less Toxic
https://time.com/6247678/openai-chatgpt-kenya-workers/

2023/04/19(水) 11:25:10.11

インド人を右に

2023/04/19(水) 11:28:04.56

これは初期だけで、途中から自己学習するんだよな？？

2023/04/19(水) 11:33:29.56

こういうの脳ぷかぷかさんが答えているんだろ
https://pbs.twimg.com/media/CpCRdb4UkAAyQUC.jpg

2023/04/19(水) 11:55:39.51

虚構だと思った

2023/04/19(水) 13:21:05.39

原発がでかい湯沸かし器と知った時のようながっかり感