大数据文摘授权转载自数据实战派AI仍然具有相当热度。|《失控玩家》中的NPC数字意识觉醒,是如何发生的?( 四 )


拥有好的测试台对人工智能研究来说很关键 。 游戏就是人工智能的测试台 , 因为它们为人工智能提供了各种挑战 , 视频游戏可以在不同可控环境下运行 , 在极短的时间内可以运行上千种变化 , 为学习算法创造了条件 。
大数据文摘授权转载自数据实战派AI仍然具有相当热度。|《失控玩家》中的NPC数字意识觉醒,是如何发生的?
文章图片
机器在游戏中进化的示意图
目前在利用游戏开发AGI的道路上走得最为坚定且最远的公司 , 应该是DeepMind 。
这家公司将神经系统科学家、人工智能程序员、电脑游戏设计者、国际象棋神童这几类人前所未有地集结在一起 , 旨在利用游戏和强化学习开发AGI 。
与当前借助深度学习方法“克隆”人类智能中的多种单点能力(例如视觉、听觉)不同 , 最近一篇系统阐释他们方法论的文章中 , DeepMind表示 , 创建AGI需要一种简单但有效的规则 。
奖励最大化就是这个规则 。 “RewardisEnough” 。
他们认为 , 奖励最大化这一通用目标 , 足以驱动自然智能和人工智能中至少大部分的智能行为 。 人类智能是在这种规则的支配下经过长期自然选择进化而得的产物 。
在游戏中开发Agent , 正是在电子世界复现这个自然规则 。 因为 , 强化学习算法强调的就是通过采取行动和获得反馈来发展行为 , 类似于人类和动物通过与环境互动来学习的方式 。
因此 , 一些科学家将强化学习描述为“第一个智能计算理论” 。
大数据文摘授权转载自数据实战派AI仍然具有相当热度。|《失控玩家》中的NPC数字意识觉醒,是如何发生的?
文章图片
他们近期一项令人印象深刻的工作 , 是训练了一种能够在不需要人类交互数据的情况下玩许多不同游戏的智能体 。 这个新项目包括一个具有真实动态的3D环境 , 和一个可以学习解决各种挑战的深度强化学习智能体 。
DeepMind的说法是 , 新系统是“朝着创建更通用智能体迈出的重要一步 , 具有在不断变化的环境中快速适应的灵活性” , 但也离实现AI领域数十年梦寐以求的通用智能依然非常远 。
Anyway , 无论前路多么漫长 , 这颗种子已经埋下 。 说不定 , 第一个AGI真的就藏身于你一直在玩的电子游戏中 。
来源:大数据文摘

相关经验推荐