対話型AI(人工知能)「ChatGPT」がもたらす破壊的な技術革新の話題で世界中が沸くなか、「AI訓練士」として働く李傑さんの反応は驚くほど薄い。

李さんをはじめとする数十人は、日本円にして1件1円にも満たない仕事をこなすため、パソコンがずらりと並ぶ部屋で1日に何千回もマウスを動かしている。

彼らの役割は、大量のテキストや音声、画像に「眼球」「四川語」「緑地帯」などのタグを付けて、AIモデルをトレーニングするための「材料」を準備することだ。「アノテーション」と呼ばれるこのようなラベル付けを行って初めて、AIモデルはデータを認識できるようになり、それによって識別能力を訓練することができる。

李さんの仕事で最も多いのは、道路画像に写っている物体の名称や色など詳細情報を追加する作業だ。効率よく進めば、1日に2000~3000件をこなせるという。1件を単価4分(約0.8円)で計算すると、月収は3000元(約5万8000円)ほど。専門学校卒で、中国北西の郡部に住む若者としてはまずまずの収入だろう。

同様の光景はアフリカ・ケニアでも見られる。首都ナイロビでは30人余りが、ChatGPT向けにアノテーター(アノテーション担当者)として働く。1日9時間、150~200段落のテキストを読み、そこに含まれる性的・暴力的な内容やヘイトスピーチにラベルを付けていく。インパクトの強い文章を日々大量に読み込むため、強烈な描写が頭から離れず1週間悪夢にうなされる人もいるという。

ここのアノテーターは時給1.32ドル(約180円)で、ノルマを達成すれば時給1.44ドル(約190円)にアップし、70ドル(約9400円)ほどのボーナスももらえる。この地域の一般的なブルーカラーよりも待遇はいい。

AIを巡るさまざまな議論が巻き起こるなか、ケニアやウガンダ、インド、中国では簡素な空間で単純作業を行う「AI訓練士」が、水面下で最先端のテクノロジーに深く関わっている。

AIはデータ、演算能力、アルゴリズムを基盤としており、データが大量かつ高品質であれば、訓練されたモデルはより「賢く」なると言われている。アノテーション分野では、その名を知らない人はいない「ImageNet」という画像データベースがある。1400万枚を超えるラベル付き画像のデータセットで、物体名(クラス名)は2万種類以上。例えば犬種だけでも120種類に上る。

https://36kr.jp/231623/