从AutoGPT出圈后AI Agent受热捧:成为继LLM后的全新焦点
Wen |王吉维
自Autogpt开火以来,该行业对AI代理商的讨论从未停止过。
Lilian Weng在其6,000名Character博客文章中根据AI代理的系统具有新的现代AI代理定义。在这一点上,“ LLM+内存+任务计划+工具”已成为新的AI代理四部件。
了解AI代理的原则,行业自然会更多,并就AI代理的探索和交流进行了交流。尤其是在经过一段时间的“ LLM登陆困难”的洗礼之后,只要他们谈论AI经纪人,企业家就会照亮他们的眼睛,投资者也很热情,大公司更渴望尝试。
结果,AI代理已成为一个新的重点,在LLM之后,在各行各业和研究中都没有人知道。
从每个人谈论大语言模型到张开的嘴是AI代理,这意味着每个人对LLM的关注确实已经达到了应用层,以及如何在地面上登陆的情况确实已成为所有领域中LLM的结局。
当涉及AI代理时,许多人认为这是LLM的产物。毕竟,大多数人都与代理商的开源代理程序(例如Autogpt,BabyGpt,GPT-GPT-GENTERER)接触。
但是,那些了解AI代理商的人应该知道,代理的概念不是当今的产物,而是智能实体概念与人工智能的不断发展的结果。
有些人认为AI代理商在1980年代起源于Wooldridge和其他人,以将代理引入人工智能。有人认为,最早的代理概念应该是1950年代人工智能的“高度智能有机体”。
也有论文(请参阅Fudan University的“基于大语言模型的代理人的兴起和潜力:评论”),将最早的代理概念追溯到丹尼斯·杜德罗(Dennis Dudelo)的“智能鹦鹉”理论。
从哲学的角度来看,代理人可以追溯到Zhuangzi,Aristotle和Lao Tzu等思想家的学说和作品,公元前280年至公元前485年。
从这些观点,学说和论文中,沿着人工智能实体的发展方向的哲学思维,它通常可以整理AI代理发展的一般背景。
在此基础上,Wang Ji频道概述了该AI代理的这一简短历史,使每个人都可以更全面地理解AI代理。
起源:哲学启蒙阶段
“特工”是一个历史悠久的概念,并且在许多领域都得到了探索和解释。
关于AI代理的最早起源,我们还必须从哲学领域开始探索可以激发人类思维的哲学领域。一些论文将它们追溯到公元前350年的亚里士多德,当时的一些哲学家描述了一些具有渴望,信仰,意图和行动能力的实体。
如果您从古代哲学家的思想中寻找代理人,您可以继续回到公元前485年左右的中国春季和秋季时期,老挝也可以在他遥远的意识形态书《 tao te ching》中看到智慧对子孙后代具有深远的影响。
这本书在第122章中写道:“陶申,两人,两人三,三生。”从现在的科学角度来看,它所描绘的“道路”可能是一个无尽的实体,宽容一切,并且可以发展自身。这种实体与种子的种子一样小,大而大。跑步,这是一种典型的自主智能。
后来的Zhuangzi是后来的,当时他是“ Zhuang Zhou Mengdie”,他不知道自己是Zhuangzi还是蝴蝶。如果我们使用现代计算技术,这个梦想可以理解为元宇宙,那么梦中的蝴蝶,包括生活中的一生,产生诸如“西方世界城镇”游戏之类的智能身体。
在18世纪,在法国思想启蒙运动中,丹尼斯·迪德罗特(Denis Diderot)也提出了类似的观点:如果鹦鹉可以回答每个问题,则可以将其视为聪明。尽管杜德尔(Dudel)在他的作品中写了鹦鹉,但每个人都可以意识到这里的“鹦鹉”并不是指鸟类,而是突出一个深刻的概念,即,高度聪明的有机身体可以拥有人类。聪明的。
这很有趣吗?我们认为现代人只会想到科学和技术的某些进步。实际上,古人长期以来一直在思考和探索。
也许正是因为这个想法是人类对各种工具的最终追求,以及卢本在春季和秋季时期和交战状态时期诞生的“木制喜p”,而莫霍(Moho)创造了城市。一家人,木牛流动的马和三个王国时期的马。指南车,唐朝“妇女妇女”的“妇女款待”,以及各种“机构”木制人,他们帮助人们在明朝工作。
这些人的早期自动化工具不是具有分析和推理能力并可以采取行动的智能对象。但是,由于远古时代以来已经存在的这些思想和实践也反映了数千年来对智力或自动化的持续追求。
当然,通过这些思想,我们也可以知道,代理人哲学的概念是指具有自主权的概念或实体。它可以是人造物体,植物或动物,当然还有人。
发展:人工智能物理化
无论最早的代理商从何而来,这些哲学思想都在不同程度上启发了现代代理商的发展。
在1950年代,艾伦·图灵(Alan Turing)将“高情报生物”的概念扩展到人工实体,并提出了著名的图灵测试。该测试是人工智能的基石,旨在探索机器是否可以显示相当于人类的智能行为。
这些人工智能实体通常称为“代理”,形成了人工智能系统的基本构造块。在这一点上,人工智能领域提到的代理通常是指使用传感器来感知其周围环境,做出决策,然后使用人工实体采取响应行动。
随着人工智能的发展,“代理人”一词在人工智能研究中找到了自己的地位,以描述诸如表现出智能行为和自主权,反应性,主动性和社会能力等实体。从那时起,代理商的探索和技术进步已成为人工智能的重点。
从1950年代末到1960年代,这是人工智能的时期。编程语言,书籍和电影似乎继续影响更多的人。
在第一个人工智能冬季之后,1980年代出现了人工智能繁荣。在此期间的各种研究取得了突破,政府和其他机构的投资也开始增加,研究人员对AI代理的探索正在逐渐增加。
但是这种繁荣只有7年,在1987年,它迎来了第二个人工智能冬季。
这种冷浪持续了很多年。尽管大多数机构在此期间缺乏财政支持,但人工智能沿现有技术途径坚决发展。
其中,AI代理是由Wooldridge和Jennings定义为1995年的计算机系统:它位于某个环境中,可以在这种环境中采取行动以实现其设计目标。他们还建议AI代理应该具有四个基本属性:自主,反应性,社会能力和主动性。
在经济学正式接受AI代理后,它被进一步定义为一种感知其环境并采取行动以最大程度地提高成功机会的系统。根据此定义,可以解决特定问题的简单程序也是“ AI代理”,因此可以在各种国际象棋游戏中与人类玩耍的机器人也是一种AI代理。
AI代理范式将AI研究定义为“智能代理研究”,该研究研究各种情报并超越了人类智能。
在1993年至2011年的AI代理的“四个基本属性”中,许多基于AI技术的代理项目出现了,当时出现了令人印象深刻的项目。
这些项目的外观和概况如下:
进化:AI Agnet的进化
随着AI技术的发展,代理商大约在2000年左右得出了许多类型。
根据智力和能力的不同层次,罗素,诺维格,彼得和其他书中的“人工智能:一种现代方法”将AI代理分为以下五个类别:
简单的反射剂:一种简单的代理类型,基于当前的感知而不是其余的感知历史记录。这种类型的问题包括非常有限的智能,对国家的非感知部分一无所知,巨大的发电和存储规模,无法适应环境变化。
基于模型的基于模型的代理:该代理使用条件操作规则来找到允许允许当前情况符合当前情况的条件的规则来工作。它通常由两个重要因素组成,即模型和内部状态。它可以通过获取世界的发展方式以及代理商的运营如何影响世界来更新代理商的状态。
基于目标的代理基于目标:这种类型根据其目标或理想条件决定,以便可以选择可以实现所需目标的操作。这种情报可以通过搜索和不同的计划来确认其实现目标的能力,并考虑一系列可能的行动,以便代理人拥有主动性。
基于基于公用事业的代理商的公共业务代理的最终使用是其构建块。有必要使用多种替代方案的最佳动作和决策。它考虑了代理商的幸福感,并给出了代理商对实用程序的幸福感的想法,因此它具有最大的有效行动。
学习代理:有能力从过去的经验中学习,采取行动或基于学习能力做出决定。它已经从过去获得了基本知识,并利用这些学习来移动和适应。通常由四个部分组成,即学习要素,评论家,绩效元素和问题产生者。
从这些类别和基本定义中,许多AI工具和早期智能程序可以归类为一种代理。包括早期IBM的深蓝色,用于国际象棋游戏和后来出现的Alphago,当时是根据最新的AI技术出现的AI代理。
现代:基于LLM的智能身体
在2012年的Imagnet计算机视觉挑战中,Alexnet的Alexnet卷积神经网络的深度学习模型赢得了第一名,此后,深度学习确实在人工智能领域表现出了技巧。
在2016年,Alphago(专门从事GO游戏的AI代理)将击败欧洲冠军(Fan Hui)和世界冠军(Li Shishi),并将被他的兄弟(Alphago Zero)击败。
2017年,Google提出的变压器。
2018年,Google根据变压器模型发布了BERT,该模型启动了大型语言模型。
2019年,Google Alphastar在视频游戏“ Starcraft 2”中到达了大师,该游戏的表现要比所有人类球员都要好0.2%。
2019年,OpenAI分别发布了GPT-2的自然语言处理模型,并分别于2020年和2022年和2022年分别发布了GPT-3,DALL·E 2和GPT-3.5。通过应用程序提供新的机会。
自2023年1月以来,全球制造商发布了多个LLM,包括Llama,Bloom,Stablelm,ChatGLM和其他开源LLM。
同时,全球技术制造商推出的数千个LLM为AI代理在各个领域的多元化应用提供了更广泛的基础。
2023年3月14日,OpenAI发布了GPT-4。 3月底,Autogpt诞生了,并迅速在世界各地传播。
Auto GPT是由OpenAI在Github上启动的免费开源项目,结合了GPT-4和GPT-3.5技术,通过API创建一个完整的项目。
与chatgpt不同,用户无需不断提出AI问题来获得相应的答案。在AutoGPT中,您只需要提供一个AI名称,描述和五个目标即可。 AutoGPT可以自己完成该项目。它可以读写文件,浏览网,查看提示的结果,并将其与提到的历史记录结合使用。
AutoGPT也是OpenAI的一个实验项目,旨在显示GPT-4语言模型的强大功能。一开始,虽然越来越多的人理解和体验自动,但他们逐渐认识到AI代理。
从此开始,总部位于LLM的AI代理开始在雨后开始涌现,并且有许多项目,例如Generation Agent,GPT-Engineer,Babyagi,Metagpt和其他物品。这些项目的爆发使LLM的开发和应用成为一个新阶段,LLM也将LLM创业和着陆降落导致AI代理。
5月,在Openai赢得了3亿美元融资的新回合之后,创始人Sam Altman透露,他更关心如何使用Chat Robots创建独立的AI代理商并将相关功能部署在Chatgpt助理中。
6月,扎克伯格在所有员工会议上宣布了一系列在不同发展阶段的技术。其中之一是AI代理,它将为用户提供不同的个性和能力,可以帮助用户帮助或娱乐。
在6月底,OpenAI安全团队负责人Lilian Weng发表了一篇题为“ LLM Powered Autonomous Agents”的文章,该文章详细介绍了LLM的AI代理商,并认为这将使LLM转向其中一位。一般问题解决方案的方式。本质
在这一点上,人们终于对AI代理有了全面的了解,AI代理的奥秘终于得到了揭示。
在人工智能领域对AI代理商的探索从未停止过。每项AI技术都获得了新的突破之后,它将将其探索和应用组织为新主题。在Alphago代表的深度学习和神经网络技术之后,基于深度学习和神经网络的代理商出现在游戏和医疗服务等许多领域中。
近年来,大语言模型已经取得了突破。 Google发布Bert和OpenAI版本GPT-2之后,许多组织开始与他们合作,开始创建基于LLM的代理商。
当我们谈论AI代理时,许多AI代理框架和产品都出现在海外。例如,截至8月底刚刚完成1500万美元的VoiceFlow现在是最受欢迎的Al Agent Construction平台之一,它是最受欢迎的开发人员。在这里有效地建立了自己的AL代理商130,000多个团队。
从这种类型的AI代理施工平台的角度来看,许多组织现在或已经建立了自己的AI代理,每个组织都可以面对多个代理商在不同的业务场景中。
Wang Jiwei频道以前还曾在全球投资60个AI代理项目。目前,已经提出了项目列表1.0。此列表将继续迭代。也欢迎推出一个AI代理商或AI代理商的团队共同改善此列表。 (PS:回复Agent+,获取完整的列表图。)
定义:当代AI代理特征
莉莲·旺(Lilian Weng)在其博客文章“ LLM动力自主代理商”中,对LLM的AI代理进行了系统评价。
她将代理定义为LLM,内存,计划技能和工具使用。其中包括关键组件,并仔细整理并解释每个模块下的实现路径。
代理系统体系结构图,摘自博客文章“ LLM动力自主代理”
从文章中不难看出,AI代理是当前控制LLM来解决问题的代理系统。 LLM的核心能力是了解和生成文本生成。如果LLM可以学习工具,LLM本身的能力也将大大扩展。 AI代理系统是这样的解决方案,它允许LLM“超级大脑”真正成为人类的“所有助手”。
在AI时代,许多AI工具似乎具有初步的代理功能。尽管AI工具包括针对自动任务的软件程序,但特定的关键功能除以AI智能而分为更复杂的AI软件。
该行业认为,当AI工具具有以下特征时,该工具可以被视为AI代理:
在这个更广泛的特征下,将来AI代理的存在的环境将更广泛,并且会有更多类型。
同时,在大型语言模型的祝福下,AI代理逐渐得出了自主代理和生成的智能代理。
自主智能(例如AutoGPT)可以自动执行任务并根据自然语言的人们的需求实现预期结果。在这种合作模型中,自主智能主要针对人类,更像是一种有效的工具。
我们目前正在谈论的大多数智能都是基于LLM自主智能的,它被认为是通用人工智能(AGI)的最有希望的途径。
如果Autogpt在今年4月开放了独立情报的幕布,那么斯坦福大学的研究人员和Google共同创建了“西部世界模拟”,开放了产生情报的道路。镇上的25个AI特工很高兴步行,约会,聊天,用餐并分享一天的新闻。
基于LLM(例如GPT-3,BERT和其他LLM)生成SMART的完整记录,并以自然语言存储代理体验。生成智能体系结构包括三个主要组成部分:观察,计划和反思。这些组件共同起作用,以产生反映其个性,偏好,技能和目标的实际行为。此外,该体系结构允许用户,代理商和其他代理进行自然语言交流。
简而言之,产生智能就像美国戏剧“西方世界”中的人形机器人和“失控玩家”中的智能NPC。他们生活在同一环境中,有自己的记忆和目标,不仅与人类,而且与人类,而且与人类,而且与人类,而且与人类,而且与人类,而且与人类,而且与人类,而且与人类,而且与人类,而且与人类,而且与人类,而且与人类,而且与人类,而且与人类,而且与人类,而且与人类,而且与人类,也与人类,也与人类相关联,也有自己的记忆和目标。而且还与人类,还有人类,还有人类。其他机器人相互作用。
未来:AI代理无处不在
代理的核心位于LLM。可以说,大语言模型的能力决定了AI代理能力的半径,因此当前的GPT-4代理更聪明。将来,随着更大语言模型的改进,迭代和优化,基于这些LLM的自然功能将更强。
未来的AI AGNET将主要介绍以下特征:
代理商将成为各个行业和领域的大型模型的主要形式。将来,LLM的开发和应用将围绕工具或助手的形式介绍。由于代理以标准化产品的形式出现,因此AI代理的引入和应用将变得更加简单。
相关企业和组织还可以根据引入的大型语言模型或垂直现场模型在现场建立代理,以帮助客户有效发布LLM。您还可以构建以内部或客户为导向的AI代理平台和社区,这对于您自己和客户操作都方便,可以随时建立所需的代理。
更多的AI代理构造平台还将促进大量代理的出现,个人建筑和应用程序代理会更容易。将来,只要每个人都愿意,他们就可以随时通过各种代理平台创建一个个性化的代理,并通过更个性化的功能和服务来增强沟通和协作,并扩大知识和技能。
它甚至可以在不同的业务场景中构建多个不同的代理,并允许这些代理人一起工作。多代理系统协作可以输出更准确的结果并完成更复杂的任务。
只要LLM可用于构建相应的代理,AI代理就会忽略行业和业务方案。它可以应用于各种行业,例如教育,医疗,金融,制造,娱乐等,以帮助提高效率,降低成本并创造价值。
将来,AI代理可能更聪明,自适应和多元化,可以处理更复杂的问题和场景,并与人类形成更紧密的合作和共生。
正如莉莲·旺(Lilian Weng)在博客文章中所说的那样,AI代理允许LLM从“超级脑”演变为“所有助手”,这意味着基于LLM的代理商助理将来将为更多的人和组织提供服务。
随着AI代理的广泛应用,在大型语言模型时代,人 - 机器的互动还将升级人类与AI代理之间的自动合作系统。这种新的人类 - 机器合作可以称为人 - 机器人智能,这将促进人类社会生产结构的进一步升级,这将影响社会的各个方面。
同时,一个具有沟通能力并可以执行自己/自动执行任务的智能网络将是Internet的下一个阶段。 AI代理将是人类互动和执行任务的智能工具。
将来,AI代理商可能会出现在人类工作,研究,生活和娱乐的各种场景中。等待电影中人类 - 机器 - 强度的场景确实将成为现实。
这将是大量市场。
参考材料:
Fudan University NLP团队论文“基于大语言模型的代理商的兴起和潜力:审查”
生活日报网·版权声明
本网站所收集的部分公开资料来源于互联网,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
本网站所提供的信息,只供参考之用。本网站不保证信息的准确性、有效性、及时性和完整性。本网站及其雇员一概毋须以任何方式就任何信息传递或传送的失误、不准确或错误,对用户或任何其他人士负任何直接或间接责任。在法律允许的范围内,本网站在此声明,不承担用户或任何人士就使用或未能使用本网站所提供的信息或任何链接所引致的任何直接、间接、附带、从属、特殊、惩罚性或惩戒性的损害赔偿。
【特别提醒】:如您不希望作品出现在本站,可联系我们要求撤下您的作品。邮箱 sunny@sdlife.com.cn