米OpenAIは3月14日(現地時間)、最新の人工知能「GPT-4」を発表した。タスクの複雑さが一定のしきい値を超えると、GPT-3.5との違いが大きくなり、より信頼性が高く、創造的で微妙な指示も処理できるようになったほか、画像入力にも対応し、処理できるようになった。現在、ChatGPTとAPIを介して、GPT-4のテキスト入力機能をリリースしている。

 1年前にリリースしたGPT-3.5にあったバグを修正し、理論的基盤を改善。敵対的テストプログラムと、ChatGPTからのフィードバックを使用し、6カ月にわたる調整を繰り返した結果、事実性および制御性の向上、逸脱の低減において、これまでにない結果を残した。

 また、Azure上でトレーニングを行なったが、GPT-4は“前例のないほど”安定していたとし、トレーニングパフォーマンスを事前に正確に予想できる最初の大規模モデルとなった。

 カジュアルな会話ではGTP-3.5とGPT-4の違いはあまりないが、複雑さが増すと違いが出てくるという。特に専門的または学術的なベンチマークでは「人間レベルのパフォーマンス」を示すとしており、模擬司法試験の場合、GPT-3.5では下位10%程度のスコアだったが、GPD-4は受験者上位10%のスコアで合格したという。ほかの既存の大規模言語モデルよりも大幅に優れているという。
長いので後はソースで
https://pc.watch.impress.co.jp/docs/news/1485859.html

多くの試験で高いスコアを実現するGPT-4
https://asset.watch.impress.co.jp/img/pcw/docs/1485/859/1_o.jpg

言語の正確性
https://asset.watch.impress.co.jp/img/pcw/docs/1485/859/2_o.jpg

画像のおかしい(面白い)ところを指摘するGPT-4
https://asset.watch.impress.co.jp/img/pcw/docs/1485/859/3_o.jpg