化慧博智能投研行业深度研究报告www.hibor.com.cn专业的提资所究大最据平句2025年3月14日按交互对不同,AI Agent可分为自主智能体(Autonomous Agent)和生成智能体(GenerativeAget):自主智能体:交互对象只有人类,是在特定应用场景中根据人类通过自然语言提出的需求,依赖内在决策机制自动执行任务,从而实现预期结果的独立运行智能体,如AutoGPT、ChatGPT+插件等应用形式:生成智能体:交互对象包括人类和其他智能体,如斯坦福和G0og1e创建的西部世界小镇,其中25个智能体在小镇上各自赋予了独特的个性和背景故事,有者组织结交、举办情人节、聊八卦等日常生活。Al Agent按交互对象不同分类自主智能体生成智能体(Autonomous Agent)(Generative Agent)自主智能体,如Auto-GPT能够根生成智能体,如斯坦福和Google据人们通过自然语言提出的需求,的研究者共同创建的西部世界小自动执行任务并实现预期结果,镇或者《西部世界》中的人形机在这种合作模式下,自主智能体Al Agent器人,它们在同一环境中生活,主要是为人类服务,更像是一个类型拥有自己的记忆和目标,不仅与高效的工具,人类交往,还会和其他机器人互动。当前应用当前应用AutoGPT,ChatGPT+插件,adept,etaGPT等PY.5 malvie小镇,oyager,GTW资料来源:《中国Al Agent行业研究》(沙利文&头豹,2024》,《Generative Ag8nWs:nteractive Simulacra of Human Behavior》《Joon Sung Park .etc.2023),中金公司研2、发展历程:大模型赋予Al Agent底层技术突玻,探素通往AGl之路(1)学习范式:大模型赋能下,Al Agent迁移学习能力快速提升AI Agent发展逾40年,大模型赋能下跨入新的智能体阶段。20世纪80年代Wooldridge等人将Agent引入人工智能,自此之后AI Agent经历了符号智能体、反应型智能体、基于强化学习的智能体、具有迁移学习和元学习功能的智能体四大发展阶段。由于只能基于学习框架学到特定技能,未能理解从而泛化性较差,此前的AI Agent只能用于特定领域。符号智能体:主要通过逻辑规则和符号封装知识促进推理过程,应用在特定技术领域。如1980年左右出现的模拟心理治疗、医学诊断专家系统等。反应型智能体:为基于反应机制的智能体,能实时感知环境并作出快速响应,主要应用于机器人、游戏AI等领域。如游戏中反应型智能体可通过学习玩家的操作习惯和战术,实时调整自己的游戏行为。基于强化学习的智能体:主要为通过智能体与环境的持续交互,利用最大化环境奖励来实现优化以期达到更高的智能水平,标志性的应用如围棋领域的AlphaGo。基于迁移学习和元学习的智能体:主要为让智能体从少量样本中迅速推理出实现指令的最优策略。LLM带来深度学习新范式,AI Agent迁移学习能力快速提升。此前的强化学习等范式主要集中在增强特定领域的技术能力,但通用能力的发展被忽视,如长期规划、有效泛化、知识记忆等。随着0 penAI陆续发布ChatGPT、GPT-4推进以文本模型为主的大模型迭代,国内外科技巨头均在AI大模型领域加快布局,LLM快速发展但其仍存在的诸多不足如幻觉、上下文容量限制等使得基础大模型无法直接通向AGI。3/36
暂无评论内容