I Taught a Monkey How to Play Minecraft
https://youtu.be/UKpFoYqN9-0
これは、マインクラフトを遊んでいる類人猿("カンジ")です!非人間の生物学的ニューラルネットワークに関する興味深い実験です 🙉
- コンテキスト内強化学習:カンジはゲーム内でマークされたマイルストーンを達成するたびに果物やピーナッツをもらいます。これにより、彼はゲーム内のガイドを追いかけるように誘引されます。
- RLHF:カンジは言語をあまり理解できませんが、トレーナーが彼を応援しているのを見て、時折彼らを応援することもあります!これにより彼は、自分が正しい道を進んでいる強い信号を得ます。
- 模倣学習:トレーナーはカンジにタスクのやり方を1回だけ示し、彼はすぐにその概念を理解します。報酬だけを使用するよりもはるかに効率的です。
- カリキュラム学習:彼らは非常にシンプルな環境から始め、徐々にカンジに操作方法を教えます。最終的には、カンジは複雑な洞窟や迷路、ネザーを移動することができます。
また、類人猿の視覚システムがいかに強力であるかに驚かされます。カンジは生まれて初めてマインクラフトを見ましたし、確かに彼の先祖も見たことはありません。
それでも彼は、自然界とは大きく異なるマインクラフトのテクスチャと物理に迅速に適応します。