在外交战略桌游中,AI学会了谈判和欺骗( 三 )


2
其实早在2022年初 , Meta AI团队便开始在《强权外交》这款游戏上实践AI的研究,那时他们投放的AI代号为Diplodocus,并为此秘密招募了一些资深玩家来与AI进行对战训练 。

不过那时对局没有开启交流功能,更多是在训练AI对局势的总体大局观,而非语言能力 。在最初,Meta团队发现AI虽然有着高效的思维,但缺乏战略游戏至关重要的大局观,就像我们常说的象棋新手,总是执着于“吃子”,结果最后因为“贪吃”输棋 。

在外交战略桌游中,AI学会了谈判和欺骗

文章插图


思考与编制语言,两套系统共同协作的Cicero
当Cicero正式登场后,它与人类玩家进行的40场对战,得分通常是人类玩家的两倍多,并且在这次实验中的众玩家里排名前10%,但比起胜利,人们更惊讶于它能在交流中隐藏自己的身份,并且施展交流的艺术 。
Cicero当然不是第一个尝试理解人类自然语言的人工智能,早在2011年,来自IBM的人工智能“沃森”,参加了美国著名的智力问答节目《危险边缘》 , 这档节目的问题范围包罗万象,难度也很高 。
在外交战略桌游中,AI学会了谈判和欺骗

文章插图


沃森(中)与它的两位对手
与沃森同台竞技的选手都见多识广,不过知识的储备对于AI显然不算难题,毕竟有着服务器里海量数据的支撑,在这方面AI没有理由会输给人类 。
在外交战略桌游中,AI学会了谈判和欺骗

文章插图


这听起来这对人类选手来说很不公平,但智力问答节目不是算数学题,除去一般的知识性提问,有许多问题的描述可能涉及一些双关语、谜语甚至是梗,能否理解这种程度的人类语言才是关键 。
那场比赛沃森最终赢得了第一名,但在这个过程中 , 它还是出现了一些错得离谱的情况 。例如当主持人提问一位美国第一夫人的名字时,沃森没能意识到“第一夫人”这条关键线索的引申义,也就是答案很明显是一位女性,而沃森仅仅是将“第一夫人”作为了一个普通的筛选条件,最后得出了自认为最符合条件的错误答案 。
在外交战略桌游中,AI学会了谈判和欺骗

文章插图


不妨回想一下你和朋友打扑克牌、玩游戏时的对话 , 在非正式场合下,人类的对话习惯可以说是无拘无束,基本可以忽视语法,但互相总是能听懂,如果你在一个日常生活中遇到讲话总是讲求“主谓宾”齐全的人 , 十有八九会感到浑身不自在 。
但正是这类自然的日常语言,却很难被程序所理解 。如今许多智能设备上的语音助手,基于网络与数据库、词库进行连接,它们可以识别一些常规命令,但想要与它们进行日常的自然对话还是不太现实,也正因为存在明显的局限 , 寻找它们的理解边界也成为了人们找乐子的方法之一 。
在外交战略桌游中,AI学会了谈判和欺骗

文章插图


例如让AI互相交流
作为一款讲求策略与话术的游戏,《强权外交》间的术语对话依然有一定的固定框架,但已经可以视作人类日常交流环境的一种 , 生活口语化的交流方式没有难住Cicero,确实是令人振奋的进步 。
在外交战略桌游中,AI学会了谈判和欺骗

文章插图


耍宝的人类手下与一丝不苟的AI战略家
3
科技并不能总是停留在概念,Cicero的应用价值又是什么?Meta公司指出,Cicero对于人类自然语言的掌握会是AI研究的一个里程碑 , 对于政治家和商人来说 , AI或许将会成为谈判的顾问,而对于玩家来说,AI将会提供更加身临其境的社交与娱乐氛围 。

相关经验推荐