なんでテストには正解するのに、chatgptは事実誤認レベルのミスをするんだ?
チューニングの方法が違うのかな