吃鸡、捉迷藏都难不倒!Deepmind推出最新泛用型游戏AI「XLand」

#人工智能AI技术#吃鸡、捉迷藏都难不倒它!Deepmind推出最新泛用型游戏AI「XLand」
XLand特殊在于能在多人游戏中建立3D第一人称化身 , 通过第一人称视角去感知游戏中环境 , 并且不断尝试、碰撞游戏规则 , 从中累积庞大数据来训练自己完成游戏目标 。
吃鸡、捉迷藏都难不倒!Deepmind推出最新泛用型游戏AI「XLand」
文章图片
还记得AlphaGo围棋下赢柯洁、李世乭的震撼时刻吗?从AlphaGo之后 , Google母公司Alphabet旗下的英国AI企业Deepmind一直在通过强化学习(Reinforcementlearning , RL)技术挑战各种游戏 , 有星海争霸2的AlphaStar、能通学西洋棋、将棋、围棋的AlphaZero、MuZero技术上也越往「无监督学习」的方向走去 。
但最近他们则把触角放到更广泛的领域 , 推出泛用度极高、可以零样本 , 而且不需要事先知道规则的通用型新游戏学习AI:XLand 。
我们知道机器学习(MachineLearning , ML)、RL都需要足够的数据来训练模型 , 反过来说只要数据不够 , RL学习的成效就不好 。 之前AlphaGoZero能震撼世人不只是它能下赢世界棋王柯洁 , 更重要的是它能不需要任何人类数据 , 就能从零开始自我学习、自我对战 。
吃鸡、捉迷藏都难不倒!Deepmind推出最新泛用型游戏AI「XLand」
文章图片
而今天的主角XLand的特殊点在于 , 它能在多人游戏环境中建立一个3D的第一人称化身 , 这个化身会通过第一人称视角去感知游戏中环境 , 并且不断尝试、碰撞游戏规则 , 从中累积庞大数据来训练自己完成游戏目标 。 要举例的话 , AlphaGoZero化身的只是「下棋的那只手」 , 但XLand是把整个人都模拟出来了!
目前Deepmind让XLand去玩夺旗、捉迷藏或KingoftheHill等游戏 , Deepmind官方说明 , XLand只要平均训练五个世代之后 , 那个AI化身的游戏表现就能有飞跃式的进步 。 Deepmind通过动作特征发现这些AI每次训练都能帮助理解自己动作的基本原理、时间条件与游戏规则 。 Deepmind还表示在吃鸡型游戏中 , XLand的AI化身甚至可以彼此间展现出很好的合作行为 。
吃鸡、捉迷藏都难不倒!Deepmind推出最新泛用型游戏AI「XLand」
文章图片
Deepmind说明XLand训练出来的模型若再加上些许的监督式学习进行微调 , 其原理类似于OpenAI的Text-KIGPT-3可以针对某些特定文本任务进行微调一样 , XLand再经过约30分钟或多1亿次的再训练后 , AI化身完成任务的成效就能再增加340% , 并且还具有解决先前无法成功任务的能力 。
从AlphaGo走到现在XLand , Deepmind展示了无监督式机器学习的高度潜力 , 也向世界证明未来训练AI的成本跟门槛将会越来越低、越来越普罗 。
吃鸡、捉迷藏都难不倒!Deepmind推出最新泛用型游戏AI「XLand」】科技改变世界 , 知识改变命运!欢迎点赞、关注“新千万个为什么” , 第一时间了解电脑、手机、相机、数码、3C等科技信息!

    相关经验推荐