大数据文摘授权转载自数据实战派AI仍然具有相当热度。|《失控玩家》中的NPC数字意识觉醒，是如何发生的？( 四 ) 大数据文摘授权转载自数据实

拥有好的测试台对人工智能研究来说很关键。游戏就是人工智能的测试台，因为它们为人工智能提供了各种挑战，视频游戏可以在不同可控环境下运行，在极短的时间内可以运行上千种变化，为学习算法创造了条件。

文章图片
机器在游戏中进化的示意图
目前在利用游戏开发AGI的道路上走得最为坚定且最远的公司，应该是DeepMind 。
这家公司将神经系统科学家、人工智能程序员、电脑游戏设计者、国际象棋神童这几类人前所未有地集结在一起，旨在利用游戏和强化学习开发AGI 。
与当前借助深度学习方法“克隆”人类智能中的多种单点能力（例如视觉、听觉）不同，最近一篇系统阐释他们方法论的文章中， DeepMind表示，创建AGI需要一种简单但有效的规则。
奖励最大化就是这个规则。 “RewardisEnough” 。
他们认为，奖励最大化这一通用目标，足以驱动自然智能和人工智能中至少大部分的智能行为。人类智能是在这种规则的支配下经过长期自然选择进化而得的产物。
在游戏中开发Agent ，正是在电子世界复现这个自然规则。因为，强化学习算法强调的就是通过采取行动和获得反馈来发展行为，类似于人类和动物通过与环境互动来学习的方式。
因此，一些科学家将强化学习描述为“第一个智能计算理论” 。

文章图片
他们近期一项令人印象深刻的工作，是训练了一种能够在不需要人类交互数据的情况下玩许多不同游戏的智能体。这个新项目包括一个具有真实动态的3D环境，和一个可以学习解决各种挑战的深度强化学习智能体。
DeepMind的说法是，新系统是“朝着创建更通用智能体迈出的重要一步，具有在不断变化的环境中快速适应的灵活性” ，但也离实现AI领域数十年梦寐以求的通用智能依然非常远。
Anyway ，无论前路多么漫长，这颗种子已经埋下。说不定，第一个AGI真的就藏身于你一直在玩的电子游戏中。
来源：大数据文摘

大数据文摘授权转载自数据实战派AI仍然具有相当热度。|《失控玩家》中的NPC数字意识觉醒，是如何发生的？( 四 )

相关经验推荐

贝加尔湖旅游几月份去好什么季节去贝加尔湖最好

封面|漫画「海贼王」第100卷封面公开

利比亚在哪里地图利比亚在哪里

长汀的特色美食介绍长汀有哪些经典美食

蜂蜜的美容作用自制蜂蜜美容剂的方法推荐

“去派出所睡觉多少钱？”8岁男孩半夜醒来发现父母不见，拨打110如此发问

初六文案?

人工整块苔藓种植方法苔藓种植技术

南海观世音菩萨的来历简介南海观世音菩萨的来历是什么

碰碰香怎么繁殖碰碰香怎么繁殖方法

腊肉要怎么做好吃吗

2023长春马拉松比赛地点在哪？ 2021长春马拉松

买的理财产品一直跌怎么办？

华为荣耀|荣耀曾经的顶级旗舰，现已下跌2179元，12GB+512GB+陶瓷后盖

普洱茶多少水温冲泡普洱茶的冲泡方法多少温度

豪猪圈舍怎么修建的

数码宝贝|数码宝贝：暴打仙人掌兽，戏耍暴龙兽，这只数码兽终于证明自己

暨南大学是985还是211 暨南大学是985还是211大学

孕妇几个月开始补钙

北京时间7月4日由斗鱼直播的英雄联盟LPL夏季赛迎来了RNG对阵SN的对决|doinb：rng最近状态回来了，训练赛打得贼猛