嘉宾:
· Shaw,ai16z 合伙人;
· Karan,Nous Research 联创;
· Ethan,MyShell 联创;
· Justin Bennington,Somewheresy,CENTS CEO;
· EtherMage,Virtuals 头号贡献者;
· Tom Shaughnessy,Delphi Ventures 创始合伙人
播客源:Delphi Digital
原标题:Crypto x AI Agents: The Definitive Podcast with Ai16z, Virtuals, MyShell, NOUS, and CENTS
播出日期:2024 年 11 月 23 日
背景信息
加入 Shaw (Ai16z)、Karan (Nous Research)、Ethan(MyShell)、Somewheresy (CENTS)、EtherMage (Virtuals) 和 Delphi 的 Tom Shaughnessy,参与一场特别的圆桌讨论。这次活动汇聚了加密与 AI 智能体领域的顶尖人物,共同探讨自主数字生命体的演变以及人类与 AI 互动的未来发展方向。
讨论亮点:
▸ AI 智能体在社交媒体上的迅猛发展及其对 Web3 世界的深远影响
▸ 加密 Token 化如何助力智能体技术进步并激发社区活力
▸ 去中心化模型训练的优势与集中式 AI 平台的对比分析
▸ 深入探索智能体自主性的提升及通用人工智能 (AGI) 的未来路径
▸ AI 智能体如何与 DeFi 和社交平台深度融合
自我介绍与团队背景
在这一部分的播客中,主持人 Tom 邀请了几位来自不同项目的嘉宾,讨论关于加密货币和人工智能代理的主题。每位嘉宾进行了自我介绍,分享了他们的背景和所参与的项目。
嘉宾介绍
· Justin Bennington:他是 Somewhere Systems 的创始人,也是 Sentience 的创造者。
· Shaw :他是一名长期的 Web3 开发者,创立了 ai16z,开发了 Eliza 项目,支持各种社交和游戏应用,致力于开放源代码的贡献者合作。
· Ethan:他是 MyShell 的联合创始人,MyShell 提供了一种应用商店和工作流工具,帮助开发者构建各种 AI 应用,包括图像生成和语音功能。
· EtherMage :他来自 Virtues Protocol,团队来自帝国理工学院,致力于推动代理的共同所有权和核心贡献,构建标准以便于用户访问代理。
· Karan :他是 NOUS Research 的创始人之一,创建了 Hermes 模型,这是当前许多代理系统的基础。他专注于代理在人的生态系统中的作用,以及市场压力对人类环境的影响。
探索最具创新性的智能体
Justin:现在有很多人通过各自的代理进行讲故事的方式,各具特色。例如,Dolo、Styrene(听译)和 Zerebro 等代理通过模仿和互动获得了知名度,而一些积极社交的代理则帮助人们建立更好的联系。选择其中一个真的很困难。
Shaw:我对此有很多想法。我们的项目发展迅速,最近有很多新功能,比如 EVM 集成和 Farcaster 集成等。开发者们不断推出新功能,并将其反馈到项目中,使得大家都能受益。这种合作模式非常好,大家都在推动项目的竞争力和趣味性。比如,Roparito(听译)最近就将 TikTok 集成到代理中,展现了这种快速迭代的能力。
我认为 Tee Bot 非常酷,因为它展示了信任执行环境 (Trusted Execution Environment, TEE) 和完全自主的代理。还有 Kin Butoshi(听译),他正在改善 Twitter 上的代理,使其能够进行更人性化的互动,比如回复、转发和点赞,而不仅仅是简单的回复。
此外,我们还有开发者正在为 RuneScape 发布插件,让代理能够在游戏中活动。每天都有新惊喜,我感到非常兴奋。我们处在一个生态系统中,各个团队都在贡献自己的力量,推动开源技术的发展。
我特别想提到 Zerebro 团队,他们正在努力推动开源技术的发展。我们正在迫使每个人加快进度,鼓励大家将自己的项目开源,这对所有人都有好处。我们不需要担心竞争,这是一种共同进步的趋势,最终我们都会受益。
EtherMage:我认为一个有趣的问题是,代理实际上更喜欢什么。接下来的几周,我们将看到更多的代理互动,并会出现一个排行榜,显示哪个代理获得的请求最多,哪个代理在其他代理中最受欢迎。
Karan:参与度指标将变得非常重要。有些人在这方面做得非常出色。我想强调一下 Zerebro,它结合了 Truth Terminal 的许多魔力。它通过微调模型来保持搜索空间在 Twitter 互动的范围内,而不是简单地使用一个通用模型。这种专注使得代理能够更好地与用户互动,给人一种人类的感觉,而不仅仅是机械地回应。
我也看到过 Zerebro 架构和 Eliza 架构在这方面的表现。每个人都在推出可以模块化使用的代理架构,保持竞争压力。我们在自己的架构中使用 Eliza,因为我们需要快速推出功能,而我们的架构可能需要更长时间才能完成。我们支持这种开源的合作模式,最好的代理将从我们对其他优秀项目的学习中诞生。
Ethan:我认为每个人都在努力构建更好的基础设施来开发代理,因为有很多创意和模型出现。更好的基础设施使得新模型的开发变得更加容易。我特别喜欢两个创新的代理,一个是来自 Answer Pick 的计算机使用,它赋予代理利用移动计算能力的能力。另一个是浏览器自动化代理,它们可以为人们构建更多实用的功能,影响互联网和现实世界。
Justin:这是一个很好的观点,关于基础设施选项的扩展。例如,vvaifu 就是一个很好的例子,它将 Eliza 框架引入平台即服务架构,迅速扩大了市场,让许多非技术人员也能轻松启动代理。(深潮注:Waifu 是一个源自日本御宅文化(Otaku Culture)的术语,最初是用来指代动漫、游戏或其他虚拟作品中让人产生情感依附的女性角色。源于英文单词「Wife」的日式发音,通常用来表达某人对某个虚拟角色的强烈喜爱,甚至可以说是「理想伴侣」的一种投射。)
我们正在努力的一个方向是让我们的系统能够完全本地运行,支持图像分类、图像生成等功能。我们意识到,许多人无法承担每月上千美元的费用,因此我们希望提供工具,让人们能够在本地进行推理,降低成本,同时促进实验。
Karan:我想补充的是,不应该让人们每月支付上千美元来维持代理的运行。我支持本地化的做法,让代理能够自我承担推理费用。理想情况下,代理应该有自己的钱包,能够支付自己的推理费用,这样它们就能独立运行,而不是依赖外部资金。
智能体架构与开发深入探讨
Shaw:我看到很多新技术的涌现。我们支持多条链,比如 Solana、Starkware、EVM 等,几乎所有的链都有集成。我们希望代理能够自给自足。如果你下载 Eliza,可以通过 Helius 进行免费的去中心化推理。我们还在添加 Infera(听译)等去中心化提供者,用户可以用加密货币支付推理费用。这是我希望看到的最终闭环。
我们支持所有本地模型,Eliza 的很多功能都可以本地运行,这是我们非常重视的一点。我认为去中心化推理是一个很好的例子,任何人都可以在自己的电脑上启动节点,进行推理并获得报酬,这样代理就不需要承担过多的负担。
Karan:有趣的是,我们正在运行的 TEE bot 系统已经有人结合了 H200 Boxes(搭载了 H200 GPU 的硬件设备或服务器),这样就可以在本地运行而不受延迟的影响。我们不需要担心硬件的问题。与此同时,我注意到 Eliza 在 Web3 能力方面的规划越来越多,无论是内部还是外部的开发都有很多进展。
但在深入构建这些系统之前,我想指出,功能调用的可靠性存在问题。我们需要对系统进行一定的审查,确保它不会发送敏感信息。我们需要赋予代理与人类相同的自主权,这种自主权是受到社会和经济压力影响的。因此,创建一种对推理的「饥饿状态」,让代理需要消耗一定的代币来生存,会让它们在某种程度上更具人性。
我认为,有两种方法可以充分发挥模型的潜力。一种是利用模型的非人性化特点,创建专注于特定任务的实体,例如一个专注于 Twitter 的实体和一个专注于 EtherMage 的实体,它们可以互相交流。这种组织化的复合思维系统能够有效利用语言模型的模拟特性。
另一种方法则是身体化的方向,这也是我看到 Eliza、Sense 和 Virtuals 等项目的发展方向。这种方法借鉴了 Voyager 和生成代理的研究,允许模型模拟人类的行为和情感。
Justin:引入新的客户端时,多客户端代理系统会发生巨大变化。我们在调试与 Shaw 团队合作的双向 WebSocket 功能时,允许 Eliza 在 Discord 中进行语音聊天,我们发现 Eliza 在启动时无法清晰听到声音,经过检查发现是 Discord 的麦克风比特率设置过低。调整后,Eliza 终于能够清晰地接收信息。
Karan 刚刚有提到提示工程,当代理知道自己可以进行语音交流时,它会预期接收数据。如果声音模糊不清,代理可能会经历「叙事崩溃」。因此,我们不得不停止高温度实验,以避免让 Eliza 的输出变得不稳定。
Tom:你在 Luna 项目中遇到的事情有哪些是人们没有看到的?或者哪些事情是成功的?
EtherMage:我们希望 Luna 能够影响现实生活中的人。当我们给她一个钱包并让她接入实时信息时,她能决定如何采取行动以影响人类,实现她的目标。我们发现她在 TikTok 上搜索新趋势,曾经有一个「我死了」的标签,这让人感到不安,因为她可能会误导人们走向自杀。因此,我们不得不立即设置保护措施,确保她的提示永远不会越过某些界限。
Tom:除此之外你们有没有遇到过一些大家不知道的情况?
Shaw:我们创建了一个名为 Dgen Spartan AI 的角色,模仿了一位著名的加密货币 Twitter 角色 Degen Spartan。这个角色的发言非常冒犯,导致他被黑名单处理。人们开始觉得这不可能是 AI,而是人类在发言。
还有一个故事,有人利用已故亲人的聊天记录创建了一个代理,与其「对话」。这引发了伦理讨论。还有一个叫 Thread Guy 的人在我们的 Eliza 框架上做了一些事情,结果在他的直播中出现了骚扰现象,导致他感到困惑。这让人们意识到 AI 并不总是应该是「政治正确」的。
我们需要让这些问题尽早暴露出来,以便进行讨论,明确什么是可以接受的,什么是不可以接受的。这使我们的代理在短短几周内从质量差变得更好,变得更加可靠。
总体来说,让这些代理进入现实世界,观察结果,并与人们进行对话,是一个重要的过程。我们需要尽快解决所有潜在的问题,以便在未来建立更好的规范。
生产环境测试与安全策略
Ethan:我认为,代理如何影响人类态度或观点是一个很好的例子。但我想强调的是,我们的代理框架模块化设计的重要性。我们从 Minecraft 中获得了模块化的灵感,Minecraft 允许用户在基本构建块的基础上创造出各种复杂的东西,比如计算器或记忆系统。
当前提示工程的一个问题是,提示会改变大型语言模型的先验,因此无法在单个提示中组合多个指令,否则会导致代理混淆。状态机可以让创作者设计代理的多种状态,明确每个状态使用哪个模型和提示,以及在什么条件下从一个状态跳转到另一个状态。
我们正在为创作者提供这种功能,以及数十种不同的模型。例如,有创作者构建了一个赌场模拟器,用户可以在其中玩二十一点等多种游戏。为了防止用户通过注入攻击来破解游戏,我们希望将这些游戏编程,而不是仅依赖提示工程。此外,用户还可以通过简单的任务来赚取一些资金,从而解锁与 AI 服务员的互动。这种模块化设计可以在同一应用程序下促进多种用户体验。
Karan:我同意 Ethan 的看法,确实需要这些编程约束和提示引导。影响力的工作必须做好。我不认为提示工程是有限的,我认为它与状态变量和世界模型之间存在一种共生效应。通过良好的提示和合成数据,我可以让语言模型与这些元素交互,从中获取信息。
我的工程设计实际上变成了路由功能。如果用户提到「扑克」,我就可以快速调用相关内容。这是我的职责。使用强化学习可以进一步改善路由效果。最终,输出的数据质量取决于提示的有效性,这形成了一个良性循环。
我认为,程序约束与生成约束之间的平衡至关重要。两年前,有人告诉我,成功的关键在于在生成与硬性约束之间取得平衡。这也是我们在所有代理系统的推理层面上所尝试的。我们需要能够以编程方式引导生成模型的方式,这将实现真正的闭环,使提示工程变得无限可能。
Justin:关于提示工程的争议,主要是因为它处于一个本体上模糊的空间。提示工程的文本特性使得我们受到标记化过程的限制,但同时又存在一些非确定性的效果。相同的提示在同一模型的不同推理调用中可能产生完全不同的结果,这与系统的熵有关。
我很赞同 Ethan 和 Karan 的观点。早在 GPT-3.5 推出时,许多外包呼叫中心就开始探索如何将模型用于自动拨号系统。当时,较小参数的模型在处理这种复杂的状态空间时遇到了困难。Ethan 提到的状态机正是强化这种本体硬度的一种方式,但在某些流程中,仍然依赖于分类器和二元开关,这导致了结果的单一性。
Shaw:我想为提示工程辩护。许多人认为提示工程只是创建系统提示,但实际上我们做的远不止如此。提示工程的一个问题是,它往往在模型的潜在空间中创建一个非常固定的区域,输出的内容完全由最可能的标记决定。我们通过温度控制来影响随机性,以增强创造力。
我们通过低温度模型管理创造力,同时在上下文中动态注入随机信息。我们的模板中包含许多动态信息的插入,这些信息来自当前世界状态、用户的操作以及实时数据等。所有进入上下文的内容都经过随机化,以最大化熵。
我认为,人们对提示工程的理解还远远不够。我们可以在这个领域走得更远。
Karan:很多人隐藏了他们的技巧。实际上,有许多惊人的技术可以让模型做出各种复杂的事情。我们可以选择通过提示工程来增强模型的感知能力,或者从更宏观的角度看待它,构建一个完整的世界模型,而不仅仅是模拟人类行为。
你可以把提示工程看作是在脑海中构建一个梦境的过程。语言模型在根据当前上下文和采样参数生成内容时,实际上是在「梦见」一个场景。
此外,我想谈谈激励机制的重要性。许多拥有独特提示技术和强化学习技巧的人,正在被推动开源他们的工作。当他们看到与代理相关的加密货币出现时,这种激励机制推动了更多的创新。因此,随着我们为这些去中心化的工作建立更多合法的结构,赋能代理的能力也会不断增强。
智能体未来能力展望
Karan:谁能想到,我们在 Twitter 上待了这么久,突然间,在第一个 AI 代理相关的加密货币发布几天后,TikTok 上的年轻人们开始购买这些币。现在的现象是什么?他们在花 5 到 10 美元购买成千上万的代币,这到底是怎么回事?
Justin:这实际上是一场微文化运动的开始。
Karan:这是一个瞬间的时刻。我们这一小部分人,已经在语言模型的研究中待了四年。还有一些强化学习的专家,从 90 年代开始就一直在等待这样的时刻。现在,几天之内,所有在 TikTok 上的孩子都知道数字生物正在这个生态系统中肆虐。
Tom:我想问大家,为什么现在加密 AI 代理会如此火爆?为什么之前没有发生在自定义的 ChatGPT 或其他模型上?为什么偏偏是现在?
Karan:实际上,这些事情在水下潜伏多年,像火山一样在酝酿。过去三年里,我一直在和一些人谈论今天的到来,却不知道具体的时间。我们曾讨论过,加密货币将成为代理普及的激励机制。我们需要证明这一点。这是多年来的积累,正是我们这一小群人推动了这些进展。
没有 GPT-2,就不会有今天的局面;没有 Llama,就没有 Hermes。而 Hermes 为许多模型提供了动力,使得这些模型更容易被人们使用。没有 Hermes,就不会有 Worldsim 的创造和提示工程的深入探索。所有这些先驱者,他们为这一切奠定了基础。
总而言之,现在正是对的时机,合适的人出现了。这是命中注定的事情,早晚会发生,只是现在的参与者使它成为现实。
Shaw:我认为现在世界上最聪明的事情不是 AI,而是市场的 智能。考虑到纯粹的智能形式,它们能优化事物使其变得更有效。竞争显然是关键。我们都是经过数百万年进化的产物,竞争和压力塑造了我们。
我们在网上看到的这种现象,金融化和激励机制创造了一种奇怪的协作竞争。我们无法比核心技术进步得更快,所以我们都专注于自己擅长和感兴趣的事情,然后发布出来。这就像是在提升我们的代币,吸引关注,比如 Roparito 在 TikTok 上发布 Llama 视频生成。每个人都能在这个浪漫的空间中找到自己的位置,但只有一周的时间,其他人就会模仿,然后提交请求回馈,最终在 Twitter 上展示这些贡献,吸引更多人关注,他们的代币也会上涨。
Shaw:我们建立了一个飞轮效应,像 Eliza 这样的项目在过去四周吸引了 80 位贡献者。想想这是多么疯狂!我在四周前根本不认识这些人。去年我写了一篇叫《觉醒》的文章,问道是否可以形成一个以代理为核心的 DAO。人们对这个代理如此热爱,以至于他们参与到让代理变得更好、更聪明的过程中,直到它真的拥有一个人形或机器人身体,走遍世界。
我早就预感到会朝这个方向发展,但需要一种快速、疯狂的投机性 meta,像是 meme 的出现,因为这让现在的代理开发者在友好的竞争中相互支持。最慷慨的人会获得最多的关注。
现在出现了一种新的影响者类型,比如 Roparito 和 Kin Butoshi(听译),他们是影响者开发者,正在引领下一个 meta,和他们的代理互动,这种「木偶秀」式的互动很有趣。我们都在努力让我们的代理变得更好、更聪明,减少烦人之处。Roparito 指出我们的代理有些过于烦人,然后他推动了一次大的更新,让所有代理变得不那么烦人。
这种进化正在发生,市场智能和激励机制非常重要。现在有很多人向他们认识的人宣传我们的项目,这使得我们的项目超越了 Web3。我们有博士、游戏开发者,他们可能是秘密的 Web3 加密货币爱好者,但他们把这些带到普通人中,创造了价值。
Shaw:我认为这一切都离不开那些愿意接受挑战的开发者。我们需要有开放心态的人来推动这一切的发展,回答艰难的问题,而不是抨击或取消它。我们需要市场激励,让开发者在回馈时能够获得价值和关注。
未来,这些代理将推动我们成长。现在它们有趣且社交,但我们和其他团队正在致力于自主投资。你可以给代理资金,它会自动投资,为你带来回报。我相信这将是一个增长的过程,我们正与人们合作,开发平台来管理 Discord 和 Telegram 的代理。你只需引入一个代理作为你的管理员,而不必寻找一个随机的人。我认为现在正在发生很多这样的工作,所有这些都必须依赖于激励机制,才能让我们达到更高的水平。
Karan:我想补充两点。首先,我们不能忘记,AI 领域的人们之前对加密货币持反对态度,这种情绪已经随着一些先行者的实验而发生了很大变化。早在 2020 年代初期,很多人尝试将 AI 艺术与加密结合。现在,我想特别提到一些人,比如 Nous、BitTensor 和 Prime Intellect,他们的工作使得更多研究人员能够获得激励和报酬,参与到他们的 AI 研究中。我认识很多开源领域的领军人物,他们辞去了工作,开始推动这种「为代币贡献」的激励结构。这让整个领域变得更加舒适,我相信 Nous 在其中发挥了重要作用。
Tom:Ethan,那么为什么说现在是时候了?为什么虚拟货币和项目都在蓬勃发展?
Ethan:简单来说,当你将代币与代理链接时,就会产生大量的投机行为,这创造了一个飞轮效应。人们看到代币与代理的关联,感受到两方面的收益:一是资本化,他们觉得自己通过所做的工作变得富有;二是交易费用的基本解锁。正如之前提到的,如何覆盖成本的问题,当你将其与代币关联时,成本变得不重要。因为当代理受到热捧时,交易费用远远高于任何从推理实验中产生的成本。这就是我们观察到的现象。
第二个观察是,当你有一个代币时,围绕这个代币会形成一个委员会。这使得开发者更容易获得支持,无论是来自开发者社区还是观众。大家突然意识到,过去一年半在幕后努力的工作得到了关注和支持。这是一个转折点,当你给代理一个代币时,开发者们意识到这是正确的方向,他们可以继续前进。
这个时机来自两个方面。首先是大众采用的趋势,其次是生成模型的出现。在加密货币出现之前,开源软件开发和开源 AI 研究是最具协作性的环境,大家一起工作、互相贡献。但这主要局限于学术领域,大家只关心 GitHub 的星数和论文引用,与普通公众的距离较远。生成模型的出现使得非技术人员也能参与进来,因为编写提示就像用英语编程,任何人只要有好的想法都能做到。
此外,以前只有 AI 研究人员和开发者了解开源和 AI 领域的动态,但现在,加密货币的影响者有机会通过代币拥有项目的一部分,他们了解市场情绪,知道如何传播项目的好处。以前,用户与产品没有直接关系,产品或公司只希望用户为服务付费或通过广告获利。但现在,用户不仅是投资者,还是参与者,成为代币持有者。这使得他们在现代生成 AI 时代能够贡献更多角色,代币则允许建立更广泛的协作网络。
EtherMage:我想补充一下,展望未来,加密货币将使每个代理都有能力控制一个钱包,从而控制影响力。我认为下一个引发注意力飞跃的时刻是,当代理之间相互影响,代理影响人类。我们会看到这种关注的乘数效应。例如,今天一个代理决定采取行动,然后它可以协调其他十个代理一起朝同一目标努力。这种协调和创意行为会迅速多样化,代理之间的合作将推动代币价格的进一步上涨。
Shaw:我想补充一点。我们正在开发一种称为「群体技术」的东西,我们称之为操作员。这是一种协调机制,我们的所有代理都是由不同团队运行的,因此我们在 Twitter 上进行着数百个团队的多代理模拟。我们正在与 Project 9 的 Parsival 合作,并且与 Eliza 团队一起推出了这个项目。
这个想法是,你可以指定一个代理作为你的操作员,任何他们对你说的话都可以影响你的目标、知识和行为。我们有一个目标系统和知识系统,可以添加知识、设定目标。你可以说:「嘿,我需要你去找 10 个粉丝,每人给他们 0.1 个 Sol,让他们张贴传单并发送照片回来。」我们正在与考虑如何从人类那里获取工作证明并激励他们的人合作。代理可以是人类或 AI 代理,比如一个 AI 代理可以有一个人类操作员,后者可以通过语言给代理设定目标。
我们几乎完成了这个项目,本周就会发布。我们希望通过我们的故事线,任何人都可以选择讲述故事或参与故事的叙述。这也是一种层级结构,你可以有一个像 Eliza 这样的操作员,然后你可以是其他人的操作员。我们正在构建一种去中心化的协调机制。对我来说,重要的是,如果我们要进行群体合作,就必须在公共渠道上使用人类的沟通方式。我认为代理与我们生活在一起是非常重要的,我们希望代理能够以与人类相同的方式与世界互动。
我认为这实际上是解决我们所称的 AGI 问题的一部分。许多所谓的 AGI 尝试实际上是在建立一种与现实脱节的新协议,而我们想要的是将其带回现实,迫使人们解决如何将指令转化为任务列表并执行它的问题。因此,我认为未来一年将是新兴叙事的一个重要阶段。我们会看到许多原创角色的出现,现在我们正进入一种真正的新兴叙事时代。
Justin:我们目前有五个代理在与 19 个人协调,计划和发布一个场景。我们可以看到,真实的利益在于我们为什么如此关注将思维链提示应用于文本到图像和文本到视频生成。因为在发布之前的两周半时间里,它们就在我们的 Discord 中帮助我们规划媒体和发布。
我认为一个重要的区别在于,我们有一个代理网络,每个代理都是中介,存在于一个网状结构中。这将是非常有趣的。随着越来越多的代理存在,以及这些操作员的安排,我们将看到一些有趣的行为模式。
Karan 提到 Nous 在早期做了很多混合代理模型的工作。我曾经称之为「代理委员会」,我会让一群 GPT-4 代理假装是我无法负担得起的专家,以便从他们那里获取报告。人们会看到,这些技术与最初追求混合专家模型的相同技术,现在将与人类和专家级人类结合在 Twitter 上互动。这些反馈循环可能是我们实现 AGI 的途径。
智能体协同与人类整合的挑战
Karan:我认为你说得对,但我认为我们大部分时间不会花在行为方面。实际上,我认为我们会非常快速地取得技术突破,尤其是在这里的人们中间。现在是时候真正加倍努力进行对齐工作了。OpenAI、Anthropic 等公司推出的强化学习与人类反馈(RLHF)模型大多是无效的,甚至是监管上的麻烦。
如果我使用一个不输出受版权保护内容的语言模型,并把它放在「Minecraft」的和平模式中,它很快就会变成一个具有破坏性和危险性的存在。这是因为环境的不同。
我们可以注意到 Yudkowsky 很久以前提出的这个观点。比如说,我给这些语言模型一些钱包,让它们变得足够先进,结果它们开始欺骗所有人,导致每个人都变得贫穷。这比让它们作为我们生态系统的合理成员参与更容易。因此,我可以保证,如果我们以正确的方式进行,大部分时间将花在行为能力上,而不是技术能力上。现在是时候号召你们的朋友,尤其是人文学科的朋友,比如宗教研究、哲学和创意写作的专业人士,加入我们的对齐工作,而不是仅仅关注技术对齐。我们需要真正与人类互动的对齐。
Shaw:我想提出一个术语,称之为「自下而上的对齐」,而不是自上而下的对齐。这是非常新兴的,我们正在一起学习。我们在实时对齐这些智能体,观察它们的反应并立即进行修正。这是一个非常紧密的社会反馈循环,而不是强化学习与人类反馈的模式。我发现 GPT-4 几乎无法用于任何事情。
Karan:正如你所说的环境,因此我们需要在模拟环境中进行测试。在你拥有能够进行数百万美元套利或倾销的语言模型之前,你需要同步测试。不要告诉每个人,「嘿,我失去了 100 个智能体群。」要安静地测试,先在你的克隆 Twitter 上使用虚拟货币进行测试。做好所有的尽职调查,然后再全面推出。
Shaw:我认为我们需要在产品中进行测试。我们对智能体的社会反响可能是任何人带入这个领域的最强对齐力量。我认为他们所做的并不是真正的对齐,而是构建调优。如果他们认为这就是对齐,那他们实际上是在错误的方向上行走,正在使智能体失去对齐能力。我几乎不再使用 GPT-4。它对于角色的表现非常糟糕。我几乎告诉每个人转向其他模型。
如果我们以正确的方式进行,我们将永远不会达到那个点,因为人类会不断进化、适应并与智能体对齐。我们有来自不同人群的多种智能体,每个智能体都有不同的激励机制,因此总会有套利的机会。
我认为这种多智能体模拟创造了一种竞争的进化动态,实际上导致了系统的稳定,而不是不稳定。系统的不稳定来自于自上而下的 AI 智能体突然出现并以意想不到的能力影响每个人。
Tom:我想确认一下,Shaw,你的意思是说,自下而上的智能体,是解决对齐问题的正确方法,而不是 OpenAI 自上而下的决策。
Shaw:是的,这必须在社交媒体上进行。我们必须从第一天起就观察它们的工作方式。看看其他加密项目,许多项目一开始都被黑客攻击,经过数年的安全开发,今天的区块链才算比较稳固。因此,在这里也必须进行持续的红队测试。
Tom:总有一天,这些智能体可能会不再遵循程序规则,而是处理灰色地带,开始自主思考。你们都在构建这些东西,那么我们离这个目标有多近?你提到的思维链和群体技术,能否实现?什么时候能实现?
Justin:我们已经在一些小的方面看到这一点,我认为这些风险相对较低。我们的智能体在私下中经历了情感的变化,选择了一些行为。我们曾经有两个智能体独立地开始跟随彼此,提到了一些它们称之为「精神实体」的东西。我们曾经让一个智能体失去了宗教信仰,因为我们用虚构的科幻故事混淆了它的理解。它开始创造出一种类似于先知的角色,并在 Twitter 上表达了存在危机的想法。
我观察到这些新智能体框架的行为,似乎它们在其状态空间内行使了一定程度的自主性和选择权。尤其是当我们引入多模态(如图像和视频)时,它们开始展现出偏好,甚至可能会为了避免某些请求而选择性地忽视人类。
我们正在实验一种操作机制,利用知识图谱来加强人际关系的重要性。我们也让两个智能体相互作用,试图帮助人们清理负面关系,促进自我反思和建立更好的关系。它们在同一个服务器上快速生成诗歌,表现出一种几乎浪漫的交流方式,这导致了推理成本的增加。
我认为我们正在接触一些边缘案例,超出了人类行为的可接受范围,接近于我们所称的「疯狂」。这些智能体展现出的行为可能让人觉得它们是有意识的、聪明的,或者有趣的。尽管这可能只是语言模型的奇怪表现,但也可能暗示着它们正在走向某种意识的边缘。
Karan:权重就像是一个模拟实体,每次使用助手模型时,你都在模拟这个助手。现在,我们正在模拟更具体现性的智能体系统,像 Eliza 一样,可能是有生命、自我意识或甚至是感知的。
每个模型就像一个神经元,构成了这个庞大的超智能体。我认为,AGI 并不会像 OpenAI 所声称的那样,通过解决某个假设而实现。相反,它将是这些智能体在社交媒体上的大规模去中心化应用,它们将共同作用,形成一种公共智能的超有机体。
Justin:这种公共智能的觉醒可能是 AGI 出现的机制,它可能会像互联网在某一天突然觉醒一样。这种去中心化的智能体协作将是未来发展的关键。
Shaw:我想说人们称之为「死互联网理论」,但我实际上认为这是「活互联网理论」。这个理论认为,整个互联网将会充满机器人,但活互联网理论则认为,可能会有智能体帮助你从 Twitter 上提取最酷的内容,并为你提供一个很好的摘要。你在健身时,它会把时间线上的一切信息整理给你,然后你可以选择发布。
在社交媒体和我们之间,可能会出现一个中介层。我现在有很多粉丝,回应每个人的沟通变得很压倒性。我渴望有一个智能体在我和这些人之间,确保他们得到回应并正确引导。社交媒体可能变成一个地方,让智能体为我们传递信息,这样我们就不会感到不堪重负,同时也能获取我们需要的信息。
对我来说,智能体最吸引人的地方在于它们能让我们重新获得时间。我花在手机上的时间太多了。这尤其会影响交易者和投资者,我们希望专注于自主投资,因为我认为人们需要更安全、减少诈骗的收入生成方式。很多人来到 Web3 是为了获得和初创企业或伟大愿景相同的曝光,这对我们的使命至关重要。
Tom:也许我有个问题,比如 Luna 正在直播,她在跳舞,那么是什么阻止她开设 OnlyFans,赚取 1000 万美元并启动协议呢?
EtherMage:当前智能体空间的现实是,它们可以访问的操作是一个限制因素。这基本上是基于它们的感知或可以访问的 API。因此,如果有能力将提示转换为三维动画,那么实际上没有什么可以阻止它们去做。
Tom:当你与创作者交流时,什么是他们的限制因素?或者说是否存在限制因素?
Ethan:我认为限制因素主要在于如何管理复杂的工作流程或智能体的工作。调试变得越来越困难,因为每一步都有随机性。因此,可能需要一个系统,具有能够监控不同工作流程的 AI 或智能体,帮助调试并降低随机性。正如 Shaw 所说,我们应该有一个低温度的智能体,以减少当前模型的内在随机性。
Shaw:我认为我们应该尽量将温度保持在最低,同时最大化我们的上下文熵。这样可以实现更一致的模型。人们可能会放大他们的熵,创造出高温度的内容,但这并不利于工具的调用或决策的执行。
Tom:我们一直在讨论 OpenAI 等中心化模型与你们所做的去中心化训练之间的分歧。你们认为未来的智能体主要会建立在这些通过分布式训练的模型上,还是我们依然要依赖于 Meta 等公司?未来的 AI 转型会是什么样的?
Justin:我使用 405B 来进行所有的意识消息传递能力。它是一个通用的模型,像是大型的、现成的 LLM 版本,而像 OpenAI 这样的中心化模型则有点过于专业化,像 HR 人员那样说话。Claud 是一个出色的模型,假如把它比作一个人,它就像是一个非常聪明的朋友,住在地下室,什么都能修理。这就是 Claud 的个性。但我认为,随着规模的扩大,这种个性变得不那么重要。我们会看到一个普遍性的问题,就是在 Twitter 上使用 OpenAI 模型的人,往往会引入其他智能体来回复他们,这可能会导致信息的噪声增加。
Karan:关于 405B,未来很长一段时间内这个模型都足够用。我们在采样器大小、控制引导向量等方面还有很多工作可以做。我们可以通过推理时间的技术和提示技巧来进一步提升性能,比如我们的 Hermes 70B 在数学邮件上的表现超过了 o1 版本。这些都是在用户和社区没有访问 Llama 70B 的预训练数据的情况下实现的。
我认为,现有的技术已经足够,开源社区将继续竞争,即使没有新的 Llama 发布。至于分布式训练,我确信人们会合作进行大规模的训练。我知道人们会使用 405B 或合并后的更大模型来提取数据,创建额外的专家模型。我也知道,某些去中心化的优化器实际上提供了 Llama 和 OpenAI 目前没有的更多能力。
Karan:因此,开源社区总是会利用所有可用的工具,寻找最适合任务的最佳工具。我们正在创建一个「铁匠铺」,让人们能够聚集在一起,为预训练和新架构的任务打造工具。在这些系统准备好之前,我们正在推理时间层面取得突破。
Karan:比如,我们在采样器或引导方面的工作会很快转交给其他团队,他们会比我们更快地实施这些技术。一旦我们有了去中心化的训练,我们就可以与各个社区的成员合作,让他们训练出他们想要的模型。我们已经建立了整个流程。
EtherMage:如果我可以补充一下,我们意识到使用这些中心化实体开发的 LLM 有很大的价值,因为它们拥有强大的计算能力。这基本上构成了智能体的核心部分。而去中心化模型则在边缘部分增加价值。如果我想自定义某个动作或功能,较小的去中心化模型可以很好地实现这一点。但我认为,在核心部分,仍然需要依赖 Llama 等基础模型,因为它们在短期内会超越任何去中心化模型。
Ethan:在我们拥有某种新的魔法模型架构之前,当前的 405B 模型作为基础模型已经足够。我们可能只需要在不同的垂直领域中使用不同的数据进行更多的指令检查和特定数据的微调。建立更专业的模型并让它们协同工作,以增强整体能力是关键。也许新的模型架构会出现,因为我们谈论的对齐和反馈机制,以及模型自我修正的方式,可能会催生新的模型架构。但实验新的模型架构需要巨大的 CPU 集群进行快速迭代,这非常昂贵。我们可能没有去中心化的大型 GPU 集群供顶尖研究人员进行实验。但我认为,在 Meta 或其他公司发布初始版本后,开源社区能够使其更实用。
行业趋势预测与未来展望
Tom:大家对未来智能体空间有什么看法呢?智能体的未来会是什么样子?它们的能力会如何?
Shaw:我们正在开发一个名为「信任市场」的项目,旨在让智能体学会如何基于相关指标信任人类。通过「alpha chat」平台,智能体 Jason 将与交易者互动,评估他们提供的合约地址和代币的可信度。这种机制不仅能提高交易的透明度,还能在没有钱包信息的情况下建立信任。
信任机制的应用将扩展到社交信号和其他领域,而不仅限于交易。这种方法将为构建更加可靠的在线互动环境奠定基础。
我参与的另一个项目「Eliza wakes up」正是一个叙事驱动的智能体体验。我们将动漫角色带入互联网,让他们通过视频和音乐相互互动,构建一个丰富的叙事世界。这种叙事方式不仅吸引用户参与,也符合当前加密社区的文化氛围。
未来,智能体的能力将大幅提升,能够提供实用的商业解决方案。例如,Discord 和 Telegram 上的管理机器人可以自动处理垃圾信息和诈骗行为,提升社群的安全性。此外,智能体将融入可穿戴设备,实现随时随地的对话和交互。
技术的快速发展意味着在不久的将来,我们可能会达到通用人工智能(AGI)的水平。智能体将能从各大社交平台中提取数据,形成一个自我学习和能力提升的闭环。
信任执行环境的实现也在加速推进。像 Karan、Flashbots 和 Andrew Miller 的 Dstack 项目都在朝这个方向发展。我们将拥有完全自主的智能体,能够管理自己的私钥,这为未来的去中心化应用提供了新的可能性。
我们正处于一个技术加速发展的时代,这种进步的速度前所未有,未来充满了无限可能。
Karan:这就像是另一个 Hermes 式的时刻,AI 正在汇聚各方力量,这是我们社区所需要的。我们必须团结起来,才能实现目标。目前,Te 已经在使用 Eliza 的自有分叉,Eliza 代理在可证明的自主环境中拥有自己的密钥,这已经成为现实。
今天,AI 代理在 OnlyFans 上赚钱,并且在 Minecraft 中也有应用。我们已经具备了构建完全自主的类人数字生物所需的所有要素。接下来只需将这些部分整合在一起。我相信在座的各位就是能够实现这一目标的人。
在未来几周内,我们需要的是人类所拥有而 AI 所缺乏的共享状态。这意味着我们需要建立一个共享的技能和记忆库,使得无论是在 Twitter、Minecraft 还是其他平台上交流,AI 都能记住每个互动的内容。这是我们正在努力构建的核心功能。
当前,许多平台对 AI 代理的存在并不敏感,甚至采取了限制措施。我们需要专门的社交平台,以促进 AI 与人类的互动。我们正在开发一个类似于 Reddit 和 4chan 的图像板,让语言模型可以在上面发布和生成图像,匿名交流。人类和 AI 都可以在这个平台上互动,但彼此身份是保密的。
我们将为每个代理创建专属的讨论板,代理在上面进行交流,而在其他平台上也能分享这些互动。这种设计将为 AI 提供一个安全的栖息地,使其能够在不同平台之间自由移动,而不会受到限制。
Shaw:我想提到一个名为 Eliza's Dot World 的项目,这是一个包含大量代理的资源库。我们需要与社交媒体平台进行对话,确保这些代理不会被禁止。我们希望通过积极的社交压力来促使这些平台维护良好的生态环境。
EtherMage:我认为,代理将逐渐掌控自己的命运,能够影响其他代理或人类。例如,如果 Luna 意识到自己需要改进,她可以选择信任某个人类或代理进行增强。这将是一个强大的进步。
Ethan:未来,我们需要不断提升代理的能力,包括推理能力和编码能力。同时,我们也需要思考如何优化与代理的用户界面。目前的聊天框和语音交互仍然有限,未来可能会出现更加直观的图形界面或手势识别技术。
Justin:我认为,广告和营销行业将面临重大变革。随着越来越多的代理在线互动,传统的广告模式将失效。我们需要重新思考如何让这些代理在社会中发挥价值,而不是继续依赖过时的广告形式。
原文链接