虚拟小镇Smallville中的AINPC生活:斯坦福和谷歌团队揭示未来游戏新模式

转载
641 天前
4496
Yangz

文章转载来源:Yangz

撰文:Benj Edwards

来源:Ars Technica

近日,斯坦福大学和谷歌的一组研究人员,包括 Joon Sung Park, Joseph C. O'Brien, Carrie J. Cai, Meredith Ringel Morris, Percy Liang 和 Michael S. Bernstein,创建了一个类似于《模拟人生》(The Sims)的微型 RPG 风格的虚拟世界,其中 25 个角色由 ChatGPT 和自定义代码控制,以高度逼真的行为独立生活。他们在周五发表的预印本学术论文《生成代理:人类行为的交互模拟》(Generative Agents: Interactive Simulacra of Human Behavior)中介绍了他们的实验。

研究人员写道:“生成代理醒来,做早餐,然后去工作;艺术家作画,作家写作;他们形成意见,互相注意,并发起对话;他们在计划第二天的工作时会记住并思考过去的日子。”

为了实现这一目标,研究人员在很大程度上依赖于一个用于社会互动的大型语言模型(LLM),特别是 ChatGPT API。此外,他们创建了一个架构,用记忆和经验来模拟思维,然后让代理在世界范围内进行互动。而人类也可以与他们互动。

他们写道:“用户可以观察和干预代理的日常计划、分享新闻、建立关系和协调小组活动。”

自 20 世纪 70 年代以来,计算机和电子游戏已经包含了计算机控制的角色,但它们此前从未能够模拟具有自然语言复杂性的社交环境。现在,凭借 ChatGPT 等生成式人工智能模型,这种模拟成为可能。虽然该小组的研究不一定是一款“游戏”,但它可能是未来动态 RPG 角色以复杂和意想不到的方式互动的原型。

一位名叫 Dennis Hansen 的推特用户在回复关于这篇论文的一篇帖子时开玩笑说:“想象一下,杀死一个 NPC,回到城市,看到他们的葬礼。”从这项研究来看,这可能不是一个牵强的场景。


Smallville 的生活


为了研究这组人工智能代理,研究人员建立了一个名为“Smallville”的虚拟城镇,其中包括房屋、咖啡馆、公园和杂货店。为了实现人与人之间的互动,这个虚拟世界以俯视的方式表现出来,使用的是复古风格的像素图形,让人想起经典的 16 位日本 RPG。

Smallville 是一个由 25 个不同个体组成的社区,每个个体由一个基本的精灵化身代表。为了捕捉每个代理人的身份以及他们与社区其他成员的联系,研究人员创建了一段自然语言描述作为种子记忆。这些描述包括关于每个代理人的职业和与其他代理人的关系的细节。例如,以下是论文中提供的一个此类种子记忆的摘录:

John Lin 是 Willow 市场和药房的一名药店店主,他喜欢帮助别人。他一直在寻找方法,使顾客获得药物的过程更容易。John Lin 与身为大学教授的妻子 Mei Lin 和学习音乐理论的儿子 Eddy Lin 住在一起。John Lin 非常爱他的家人。

作为一个虚拟环境,Smallville 分为区域和对象。人类用户可以作为现有或新代理进入世界,用户和代理都可以通过操作影响对象的状态。人类用户还可以通过对话或通过发出指令作为“内心的声音”与人工智能代理互动。用户使用自然语言进行交流,指定代理,或者可以使用内心的声音来影响代理的行为。

在开发该虚拟世界时,一个特别的挑战来自于 LLM 有限的“内存”。这种内存以“上下文窗口”的形式出现,即 ChatGPT 一次可以处理的 token(词块)的数量。为了克服这些限制,研究人员设计了一个系统,在该系统中,“代理人记忆中最相关的部分”在需要时被检索和合成。

“代理感知他们的环境,所有的感知都保存在代理的经验的综合记录中,称为记忆流。基于他们的感知,架构检索相关的记忆,然后使用这些检索的行动来决定一个行动。这些检索到的记忆也被用来形成较长期的计划,并创造更高层次的反思,这些都被输入到记忆流中供将来使用。”

有趣的是,当沙盒世界中的人物遇到对方时,他们经常使用 ChatGPT 提供的自然语言相互交谈。通过这种方式,他们交换信息并形成关于他们日常生活的记忆。当研究人员将这些基本成分结合在一起并运行模拟时,有趣的事情开始发生。


突发行为


在论文中,研究人员列出了模拟中出现的三种突发行为。这些都不是预先编程的,而是由代理人之间的互动产生的。

这些行为包括“信息扩散”(代理人相互告诉对方信息,并让其在城镇中进行社交传播)、“关系记忆”(记忆代理人之间过去的互动,并在以后提到这些早期事件)和“协调”(与其他代理人一起计划并参加情人节派对)。

在情人节实验中,一个名叫 Isabella Rodriguez 的人工智能代理在“霍布斯咖啡馆”策划了一个情人节派对,并邀请了朋友和顾客。她在朋友 Maria 的帮助下装饰了咖啡馆,并邀请她的暗恋对象 Klaus 参加派对。

研究人员写道:“只从一个用户指定的概念开始,即一个代理想举办一个情人节派对,”“这些代理在接下来的两天里自主地传播派对的邀请,结识新朋友,互相邀约参加派对,并协调在正确的时间一起出现在派对上。”

虽然有 12 名代理通过别人听说了这个派对,但只有 5 名代理(包括 Klaus 和 Maria)最终参加了派对。三名代理说他们太忙了,而另外四位只是单纯没去。这次经历是一个有趣的例子,说明了在虚拟世界中复杂的社会互动中可能出现的意外情况。


比人类更人性化?


作为研究的一部分,该小组聘请了人类评估员观看模拟的重播,以衡量人工智能代理根据他们的环境和经验产生可信行为的程度,包括“可信的计划、反应和想法”以及“信息扩散、关系形成和代理在社区不同区域的协调”。

研究人员还要求人们用他们所观看的回放中的代理人的声音来扮演代理人对采访问题的回答。有趣的是,他们发现“完整的生成式代理架构”产生的结果比进行角色扮演的人类更可信。

这就导致了其他问题,比如这项技术的道德影响和风险。研究人员提醒说,风险包括形成不适当的“寄生社会关系”,不正确的推断的影响,加剧与生成式人工智能相关的现有风险,以及在设计过程中过度依赖生成式代理的风险。

为了确保道德和社会责任的部署,研究人员认为,开发人员应该坚持一些原则,如明确披露代理的计算性质,确保价值一致,遵循人类 - 人工智能设计的最佳实践,维护输入和输出的审计日志,以及在研究和设计过程中不取代真正的人类输入。

为了了解 Smallville 的情况,研究人员还通过一个特殊的网站在发布了一个互动演示,但这是论文中描述的“预先计算的模拟重放”,而不是实时模拟。不过,该演示还是很好地说明了在计算机沙盒中运行的一个看似简单的虚拟世界所能产生的丰富的社会互动。