目录

对大模型时代相关概念的理解

之前一直对于大模型agent的概念不理解,不知道他与LLM是什么关系。这次借助看到的两篇微信公众号文章和别人视频中的讲述,来记录一下对agnet的理解。

最近看到的两篇文章描述了两个商用agent。美团悄悄上线了生活Agent,懒人的春天真的要来了。 淘宝悄悄上线了AI导购,懒人购物原来可以这么爽。 从上面两篇文章中,我认为 AI agent是一种在特定场景中能够利用LLM能力来执行特定具体任务的程序。 例如美团小美能够在美团应用中利用用户的历史订单数据,通过大模型来分析这些数据,根据用户的要求来进行决策,并进一步利用美团应用的相关功能来进行操作。用户可以对小美说“根据我的以往的喜好帮我点一份午餐”,如果是普通的LLM由于上下文信息不足只能说出一堆猜测并且仅仅是给用户回复文字或者图片而已。但是美团的小美agent由于具有用户的历史数据,因此可以将次作为上下文结合用户的需求做进一步的推理,从而决策出用户想要的午餐,并进一步利用美团APP的能力直接为用户进行点单操作。在这个场景中,AI agent不仅利用了大模型的推理能力,更利用了美团app的能力来获取更充足的上下文信息和做进一步决策的的能力。 淘宝的AI导购具有同样的特点。他能够根据用户的历史购物特点或者根据用户给出的商品的一些特性,从淘宝的海量信息中利用大模型的推理能力筛选出合适的商品提供给用户。与普通的大模型的区别是拥有能够获取淘宝信息详情的能力,或者直接下单的能力。

以下观点来源于Agent 的概念、原理与构建模式 —— 从零打造一个简化版的 Claude Code。 传统的大模型语言对话程序擅长回答问题,但是无法感知或改变外界环境。例如GPT4o可以写代码,但是无法将代码写入文件无法运行代码。把大模型和一堆工具组装起来,变成一个能感知和改变外界环境的智能程序,称之为agent。 Cursor是一个用于编程的agent。只需要用自然语言描述出你的需求,它就会调用大模型和各种工具来写代码,直到完成任务。

mcp的全称是Model Context Protocol