AIの学習データに含まれる個人情報が、ChatGPTにとって“大問題”になる
会話型AI「ChatGPT」のイタリアからの利用をOpenAIが停止した。
学習データに含まれる個人情報の使用を停止するようイタリア当局が求めたことが理由で、
大規模言語モデルにおけるデータのセキュリティと
プライバシーが今後さらに問題化していく可能性が高い。

OpenAIが大規模言語モデル「GPT-3」を2020年7月に発表したとき、
その学習データの内容の一部が公開されている。
技術文書によると、ウェブページや掲示板サイト「Reddit」の投稿、
書籍などから取得された数百万ページ分のデータが、この文章生成システムの開発に使われていた。
さらに人々がオンラインで共有する個人情報の一部もデータには含まれていたことから、
OpenAIにトラブルをもたらすことになったのである。

イタリアの個人データ保護当局(GPDP)が2023年3月31日、
OpenAIが使用する学習データに含まれる数百万人のイタリア人の個人情報の使用を停止するよう、
同社に求める緊急暫定措置を講じた。GPDPによると、OpenAIは同社の会話型AI「ChatGPT」で人々の個人情報を使用する法的権利を有していないという。
この決定を受けてOpenAIは、イタリア国内からのChatGPTへのアクセスを停止し、
調査を進めている当局に回答を提供する予定だ。

https://wired.jp/article/italy-ban-chatgpt-privacy-gdpr/