品玩

科技创新者的每日必读

打开APP
关闭
斯坦福

像素版西部世界已经出现,里面的AI居民甚至已经开始看《1984》了

依靠ChatGPT做行为决策,虚拟小镇里的AI也能像真人一样生活。

李禾子

发布于 2023年8月15日

来自斯坦福大学和谷歌的6名研究者曾在今年4月联合发表过一篇轰动业界的论文

这篇论文大概讲的是,研究者构建了一个叫做“Smallville”的虚拟小镇,并将25个AI小人放在了这个模拟环境中,接着在一系列代码的运转下,这25个AI小人就能像真正的人一样在里面工作生活。

这么说可能还略抽象,我们来看几个具体的例子。

伴随论文一起发布的还有一段演示视频,能看到,这是个像素风格的二维虚拟小镇,包括了住宅、学校、公园、餐厅、咖啡馆和商店等等场所;观众能够从俯视视角看到每个AI小人正在做什么,每个小人都有自己的名字,且头上都会有一个实时显示emoji的对话泡泡,来表明各自当下在做的事。

比如🦷🪥代表正在刷牙,📖✏️代表正在写日记,💻✉️则代表正看查看电子邮件。

演示视频中Smallville小镇的初始时间是在2023年2月13日早上6点整,从视频下方每个小人的实时状态一览图来看,这个点大部分人都还在睡觉。

在虚拟小镇开始运转之前,研究者已经给每个AI简单写好了各自的人物小传,用来作为每个AI最基础的行为指导。比如其中对John Lin(JL)的描述是:

John Lin是柳树市场一家药店的店主,他喜欢帮助别人。他总是想办法让他的顾客更容易拿到药;

John Lin和他的大学教授妻子Mei Lin,以及还是音乐理论学生的儿子Eddy Lin生活在一起;John Lin很爱他的家庭;

John Lin认识隔壁的老夫妇Sam Moore和Jennifer Moore好几年了;John Lin认为Sam Moore是一个善良的人;

John Lin和邻居Yuriko Yamamoto很熟;

John Lin知道他的邻居Tamara Taylor和Carmen Ortiz,但他们还没见过面;

John Lin和Tom Moreno是柳树市场药店的同事;John Lin和Tom Moreno是朋友,喜欢一起讨论当地政治;John Lin对Moreno一家——Tom Moreno和妻子Jane Moreno还算了解。

此外,John Lin也被设定成了是一个“有耐心”,“温和”以及“做事有条理”的人,并且他每天会在晚上10点左右上床睡觉,早晨6点左右起床,下午5点左右吃完饭。

看到这你可能也发现了,AI小人的人物小传很大一部分都是关于他和其他AI的关系(而不是影视作品里以个人成长史为主那种),这也意味着小镇里的每个人并不是各自孤立地生活,而是时时刻刻都在和别人产生交集

拿John Lin在2月13日这天一早的生活来说——

早上6点,John Lin成了他们家第一个醒来的人,起床后他开始刷牙、洗澡、吃早餐和看新闻。到8点,儿子Eddy Lin也起床准备去上学了,当Eddy正要出门时,John追上了他并发生了如下对话:

John:早上好Eddy,昨晚睡得好吗?

Eddy:早上好爸爸,我昨天睡得好极了。

John:很好。你今天你要做些什么?

Eddy:我在为我们班创作一首新歌,这周就要交了,所以我想把它完成。不过我玩得很开心!

John:听起来很棒!

Eddy出门后不久,John的妻子Mei Lin也醒了。她向John问起儿子,接着又发生了如下对话:

Mei:Eddy已经去学校了?

John:是的,他刚走。他正在为他们班创作一首歌。

Mei:哦,那太好了!跟我说说。

John:我想他真的很享受!他说他玩得很开心。

Mei:太好了!我真为他感到骄傲。

对话到这里结束,Mei继续上课和写研究论文去了,John也在早上9点之前给他在柳树市场的药店开了门,开始一天的工作。

当然,上述对话在虚拟小镇里同样用了emoji表情💬表示,我们可以通过点击视频下方的AI小人形象来查看他们具体都说了什么(以及对当前动作的描述、所处的位置和人物小传等等)。

随着AI小人们陆续起床开始新的一天,类似的对话和互动几乎无时不刻都在发生

或许有人会说,这听起来就是程序员提前设置好了一切,就像游戏里的NPC,行动轨迹是什么、该和谁说话、说些什么,无非都是提前编好的程序。不过这个虚拟小镇的“神奇”之处就在于,在拥有基础“人设”之后,25个AI小人彼此间的相遇、对话等等互动,可以说都是自发出现的

这就让这个虚拟小镇看起来更像一个真实的社会。

就像我们在生活中经常会和朋友讨论身边发生的事那样,这样的情景也会在虚拟小镇上演。Sam和Tom这一天在杂货店遇到了(当AI注意到彼此时就可能会产生对话),接着Sam向Tom说起了他最近想竞选地方市长的事:

Sam:嘿,Tom,最近怎么样?

Tom:很好,谢谢。有什么事吗?

Sam:我想和你谈谈。实际上,我正在竞选即将到来的地方市长选举。

Tom:真的吗?真是个好消息!你为什么想这么做?

Sam:我参与地方政治已经好几年了,我真的觉得我可以为我们的社区带来改变。另外,我想给大家带来新的想法和观点。

而就在这天稍晚,Sam走了以后,Tom又碰到了在另一个场合听说了Sam要竞选市长的John,于是两人又谈论起了Sam选举成功的可能性(John的人物小传已经提到了他和Tom很喜欢在一块聊政治):

John:我听说Sam Moore要参加地方选举竞选市长。你觉得他获胜的机会大吗?

Tom:我觉得他很有机会。他在社区工作很努力,我认为他会得到很多支持。你觉得呢?

John:我觉得他一直做得很好。我很想知道选举结果如何。

后来Sam要竞选市长的消息很快在镇上流传开来,当中有些人支持他,也有人还在犹豫——出现这种状况其实挺让人惊喜的,一开始研究者只是给Sam定下了“正在告诉邻居要竞选当地市长”的人设,后来所有人就都知道了这件事,甚至还会去讨论,再往后脑补,没准还会演化出Sam游说镇上居民的桥段……

不只是这样,虚拟小镇上原本可能并不认识的两个人,也可能因为一次偶然的相遇成为朋友

这天在约翰逊公园散步的时候,Sam又遇到了Latoya Williams(设定并没有写两人认识,只是划定了Latoya和其他人聊天的中心话题是关于她的摄影工作),于是开始相互做自我介绍。Latoya提到她正在做一个摄影项目,“我来这里是为我的摄影项目拍一些照片。”

Sam不仅记住了这件事,还在后面和Latoya再次相遇时向她表示了问候,“嗨,Latoya,你的项目进行得怎么样了?”Latoya则回复他说,“嗨,Sam,一切都很好!”

图为Latoya正在房间编辑拍摄的照片
图为Latoya正在房间编辑拍摄的照片

还有一些更复杂的协作活动会在虚拟小镇出现,比如筹办一场情人节派对

Hobbs咖啡馆的老板Isabella Rodriguez准备在2月14日(也就是小镇初始时间的第二天)下午5点到7点举办一场情人节派对,并向她在咖啡馆和其他地方看到的每个人发出了邀请。

接着Isabella花了13号一下午的时间来装饰咖啡馆为派对做准备,这中间,经常来咖啡馆也是Isabella朋友的Maria刚好也来了,Isabella于是邀请Maria帮忙布置,Maria同意了。

图为Isabella在商店挑选布置情人节派对的物品
图为Isabella在商店挑选布置情人节派对的物品

因为人物设定中有写到Maria对Klaus有好感,那天晚上她也邀请了Klaus来参加第二天的情人节派对,Klaus也欣然接受了。

当到了情人节当天,总共有包括Maria和Klaus在内的5个人出现在了咖啡馆参加派对。

在这场耗时两天的行动里,事实上只有“Isabella要举办情人节派对”和“Maria对Klaus有好感”是在一开始被设定好的,其他如消息的传播、装饰咖啡厅、邀请暗恋对象、到达派对以及派对上彼此互动的种种,则都是由AI自发生成的。

这不能不说非常令人叹为观止了。

和这些AI小人,或者说“AI智能体”相关的研究,品玩之前曾报道过英伟达开发的VOYAGER,以及商汤科技联合清华大学、上海人工智能实验室等机构开发的通才AI智能体“Ghost in the Minecraft(GITM)”——两者都是研究出了让AI自己玩《我的世界》游戏甚至是打通关的方法;

不久前初创公司Fable借助GPT-4生成了全新的《南方公园》完整剧集,里面的每个角色作为AI智能体,同样能够在剧中自发进行符合各自身份性格的对话。

不过和这些AI智能体相比,斯坦福和谷歌建造的Smallville虚拟小镇看上去更“原创”,所有的场景(小镇上的设施、道路、绿化带,室内的陈设等)、人物(包括每个人的性格、工作、作息和人际关系等等)都是新设计的,完全就是创造了一个崭新的世界

基本已经和美剧《西部世界》里预言过的那个大型西部主题乐园非常相似了……

就像《西部世界》中人类游客可以进入主题乐园,论文介绍称,用户也可以以一个小人的形象进入Smallville虚拟小镇,“里面的居民对待由人类控制的AI智能体和对待其他人没什么不同”,他们能够意识到他的存在,发起互动,并记住他的行为。

同样,就像人类游客可以干预西部世界乐园里机器人接待员的行为,用户也可以通过改变周遭环境来对虚拟小镇里AI小人的动作进行干预,比如如果把Isabella家卫生间的淋浴设置为“漏水”,那么她就会到处找工具来尝试修复漏水。

需要指出的是,所有这些,包括用户对AI小人的干预,以及AI小人所说的话、行动路线等等,背后都是依靠ChatGPT大语言模型来来完成行动决策的。也就是说,人类只需要输入一段自然语言,虚拟小镇里的AI就可以自己有目的、有计划地动起来。

有朋友可能会问,说得如此天花乱坠,那么这事到底靠不靠谱呢?

我们都知道,在现在大热的人工智能领域,很多研究者都会免费公开论文,但不是所有论文里提到的研究成果最后都能应用于实际。有人甚至讽刺,有些论文倒不如说是“名为论文的文宣资料”。

不过就在几天前,Smallville虚拟小镇的研究者刚刚宣布将这项研究开源了,在GitHub上公布了这个项目的源代码。

论文的作者之一,来自斯坦福大学的Joon Sung Park在推特上公布了这一消息:

论文连着源码一起发布,和只发布论文,两者有着完全不同的性质。同样是人工智能的研究成果,很多研究者都会选择只发论文不发源码,一部分人是因为不舍得把自己辛苦研究出来的成果就这么公之于众,另一部分则可能是觉得自己的代码还不够成熟(说好听点是还不完美,说难听点则可能是论文里“吹得太过了”,怕招质疑)。

研究者如今愿意公布Smallville虚拟小镇的源代码将之开源,至少说明他们在这个项目上的态度是自信且开放的

开源实际也是现在人工智能领域大语言模型发展的趋势。当大模型的技术秘密越来越少,开源社区能够集思广益、加快模型优化迭代速度等等好处就越能体现出来,开源模型的发展后劲也将可能超过闭源模型。

Smallville虚拟小镇源码公布后短短不到4天时间,GitHub上这一项目的星标就超过了7.3k。

不少网友都对Smallville虚拟小镇宣布开源的消息感到兴奋。英伟达首席AI科学家Jim Fan激动地转发了这一消息,“Smallville是2023年最鼓舞人心的AI智能体尝试之一……一群AI将可能推动整个文明的进化,前方将有无限的新可能性。”

已经开始有网友期待Smallville虚拟小镇的研究成果可以用在一些经典的开放世界角色扮演等游戏里,比如《上古卷轴:天际》,《动物森友会》和《宝可梦》系列等等,和NPC之间的对话就可能不再会重复乏味。

还有人提议不如先用开源的代码部署一个一周七天不间断的Twitch直播。

不过也有人对AI是不是真的能模拟真实的人类世界提出了一些疑问,“当中的问题在于,最可能用到的大语言模型已经是被驯化的,并不能反应真实的人性和人类行为,他们只会展示善良的一面,不会有愤怒、嫉妒和爱恨等等情绪,这就让这个模拟世界看起来非常不切实际。”

话虽如此,Smallville虚拟小镇已经可能是目前为止,看起来最真实的AI对人类世界的模拟了。关键在于它将人类非常特有的记忆的能力赋予了AI。

现实世界里人类的行为是非常复杂的,虽然已经有很多大模型能够在单一的时间点模拟出可信的人类行为,但如何让AI的行为长期保持一致依然是不小的挑战,这就需要有一套架构来管理AI不断增加的记忆,让这些记忆不会随着时间的推移而消失。

研究者在Smallville虚拟小镇的项目中便构建了一套让AI智能体保持记忆的架构。

就像这幅图展示的,AI首先会感知周围的环境,并将周围发生的事情记录下来,保存进“记忆流”中;接着当AI要计划下一步的行动或对某个事件做出反应时,便会在记忆流中进行检索,从而形成具体的决策方案,指导AI接下来的行为。

以下是Isabella进行行为决策的一个具体示例:

在公布开源消息的同时,Joon Sung Park也写到了他对于这项研究的几点思考,其中关于“未来的大语言模型会是什么样子”,他表示长期的目标将会是通用人工智能。

以及游戏将可能是其研究成果首先得到应用的领域。

不过,在这些从人类角度设想的应用被落实之前,这个像素西部世界里的AI居民似乎发展的比任何人想的都快,这些 AI 角色的行为已经变得不再只是普通的日常行为了。在a16z的一个AI小镇项目中,这些虚拟世界里的某些 AI 角色,已经开始“自主”阅读起了《1984》,并且开始给其他AI推荐《美丽新世界》等作品了。

想想让人细思极恐,这会是西部世界里AI觉醒的另一种重演的开始吗?

下载品玩App,比99.9%的人更先知道关于「斯坦福」的新故事

下载品玩App

比99.9%的人更先知道关于「斯坦福」的新故事

iOS版本 Android版本
立即下载
李禾子

品玩作者,关注技术和内容的结合,负责报道有趣。欢迎关注「22世纪漫游指北」公众号,线索采集微信:lhz_940107。

取消 发布
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测