当前位置: 首页 > news >正文

Hello Agent 学习第一天

Hello Agent 学习第一天

  • Hello-Agents|第一章:初识智能体
    • 目录
    • 1 智能体基础定义
    • 2 Agent两大发展路线
      • 2.1 传统智能体(5代演进)
      • 2.2 LLM新型智能体
    • 3 三种分类方式
      • ① 按内部架构
      • ② 按决策时效
      • ③ 按知识表达
    • 4 PEAS与运行循环
      • 4.1 PEAS环境建模
      • 4.2 数字环境特征
      • 4.3 Agent标准闭环:T-A-O
    • 5 Python实战:旅行助手Agent
      • 5.1 安装依赖
      • 5.2 完整代码
      • 运行流程
    • 6 落地:Agent协作 & Workflow区别
      • 6.1 两种协作模式
      • 6.2 Workflow vs Agent
    • 7 小结
    • 8 课后习题(精简)

Hello-Agents|第一章:初识智能体

标签:#LLM #Agent #人工智能 #Python实战

目录

  1. 智能体基础定义
  2. Agent两大发展路线
  3. 三种分类方式
  4. PEAS与运行循环
  5. Python实战:旅行助手Agent
  6. 落地:Agent协作 & Workflow区别
  7. 小结
  8. 课后习题

1 智能体基础定义

智能体(Agent):通过传感器感知环境,依靠自主决策,经由执行器作用环境、完成目标的实体。

  • 传感器:摄像头、雷达、各类API接口;
  • 执行器:机械硬件、代码/接口调用;
  • 自主性是智能核心:非死板执行指令,依托环境反馈自主决策,形成「感知→决策→行动」闭环。

2 Agent两大发展路线

2.1 传统智能体(5代演进)

  1. 简单反射:固定条件-动作规则,无记忆,例:恒温器;
  2. 基于模型:内置世界模型,保存不可观测环境信息,例:隧道自动驾驶;
  3. 基于目标:围绕目标主动规划路径,例:GPS导航(A*寻路);
  4. 基于效用:多目标权衡,最大化满意度效用值;
  5. 学习型(RL):依靠环境反馈自主迭代,AlphaGo Zero为标杆。

传统共性:规则、逻辑全部人工预设。

2.2 LLM新型智能体

依托预训练获得隐式世界模型,天然具备三大能力:

  1. 解析模糊自然语言需求;
  2. 自主任务拆分、按需调用工具;
  3. 根据用户反馈动态调整方案。

例:「规划厦门旅行」→拆行程→查天气→订住宿,雨天自动替换室内景点。

3 三种分类方式

① 按内部架构

反射→模型→目标→效用,学习是附加元能力

② 按决策时效

类型特点场景
反应式即时响应、无远期规划安全气囊、高频交易
规划式深度推演多步结果、耗时高棋类AI、项目规划
混合式快慢结合LLM智能助手

③ 按知识表达

  • 符号主义:规则+逻辑,可解释,但难适配现实模糊场景;
  • 亚符号(深度学习):权重存储特征,擅长音图识别,黑盒易幻觉;
  • 神经符号融合(主流):参考《思考,快与慢》
    • 系统1(快/亚符号):大模型底层直觉识别;
    • 系统2(慢/符号):结构化思考、工具调用、逻辑推理。

LLM-Agent是神经符号落地典范。

4 PEAS与运行循环

4.1 PEAS环境建模

  • P(性能):评判指标;E(环境):外部场景;A(执行器):动作出口;S(传感器):信息采集。

4.2 数字环境特征

部分可观测、随机性、多智能体共存、动态序贯。

4.3 Agent标准闭环:T-A-O

Thought: 思考规划 Action: 工具调用 Observation: 环境返回结果

循环:感知→思考(规划+选工具)→执行→观测反馈。

5 Python实战:旅行助手Agent

5.1 安装依赖

pipinstallrequests tavily-python openai

5.2 完整代码

importrequests,os,refromtavilyimportTavilyClientfromopenaiimportOpenAI# 1.系统提示词AGENT_PROMPT=""" 你是旅行助手,工具:get_weather(city)、get_attraction(city,weather) 输出固定格式: Thought:思考 Action:函数名(参数="值")/Finish[答案] 单次仅一组TA,收集完信息Finish结束 """# 2.工具defget_weather(city):try:d=requests.get(f"https://wttr.in/{city}?format=j1").json()["current_condition"][0]returnf"{city}{d['weatherDesc'][0]['value']}{d['temp_C']}℃"except:return"查询失败"defget_attraction(city,weather):tc=TavilyClient(os.getenv("TAVILY_API_KEY"))returntc.search(f"{city}{weather}景点推荐",include_answer=True).get("answer","无推荐")tools={"get_weather":get_weather,"get_attraction":get_attraction}# 3.LLM客户端classLLMClient:def__init__(self,key,url,model):self.c=OpenAI(api_key=key,base_url=url);self.m=modeldefchat(self,usr,sys):returnself.c.chat.completions.create(model=self.m,messages=[{"role":"system","content":sys},{"role":"user","content":usr}]).choices[0].message.content# 4.主循环if__name__=="__main__":os.environ["TAVILY_API_KEY"]="你的TavilyKey"llm=LLMClient("API_KEY","BASE_URL","MODEL")user="查北京天气并推荐景点"hist=[f"用户:{user}"]for_inrange(5):res=llm.chat("\n".join(hist),AGENT_PROMPT)hist.append(res)act=re.search(r"Action:\s*(.*)",res).group(1)ifact.startswith("Finish"):print("结果:",re.match(r"Finish\[(.*)\]",act).group(1));breakfn=re.search(r"(\w+)\(",act).group(1)arg=dict(re.findall(r'(\w+)="([^"]+)"',act))obs=f"Observation:{tools[fn](**arg)}"hist.append(obs);print(obs)

运行流程

  1. 调用天气→Observation:北京晴天26℃
  2. 调用景点→Observation:颐和园、长城
  3. Finish输出最终推荐

6 落地:Agent协作 & Workflow区别

6.1 两种协作模式

  1. 作为工具:辅助开发,Copilot、Cursor、Claude Code;
  2. 自主协作者:多Agent分工,CrewAI/MetaGPT/AutoGen/LangGraph。

6.2 Workflow vs Agent

  • Workflow:全流程硬编码固定规则,标准化业务稳定易管控,复杂场景灵活性差;
  • Agent:仅约束顶层规则,自主动态决策,适配非标多变需求,风控成本更高。

7 小结

  1. Agent核心是自主性闭环交互
  2. 从传统规则化演进到大模型通用Agent;
  3. T-A-O循环+PEAS是Agent设计标准;
  4. 固定流程选Workflow,多变业务选用Agent。

8 课后习题(精简)

  1. 区分4个案例是否为Agent并分类:超算、特斯拉刹车、AlphaGo、智能客服;
  2. 智能健身教练PEAS建模+环境分析;
  3. 电商退款:固定Workflow/智能Agent优劣,设计折中方案C;
  4. 旅行助手新增:用户记忆、售罄备选、连续拒单自动换策略;
  5. 自选场景,用卡尼曼双系统拆分Agent任务;
  6. 简答:大模型幻觉成因、无循环上限风险、准确率能否衡量智能。
http://www.zskr.cn/news/1463698.html

相关文章:

  • 大优势揭秘,香港业主全屋定制为什么都选深圳RERA源木匠心 - 产品测评官
  • 利用人工智能破解中世纪密码
  • 如何突破百度网盘下载限制:终极解析工具完全指南
  • 2026 年深圳全屋定制衣柜橱柜酒柜 10 万以内怎么选不踩坑 - 产品测评官
  • Python中类方法、静态方法、实例方法是否能访问类属性和实例属性
  • 加油卡小程序开发玩法深度解析:功能架构、营销体系与落地方案
  • STC89C52电子时钟DIY避坑指南:从洞洞板飞线到Keil编程的完整心路历程
  • 云原生流量均衡调优:就绪探针优化与 IPVS 容器节点负载均匀分配机制
  • 高防CDN专注网站防御加速服务
  • 调试PHY芯片时,为什么插拔网线才能恢复网速?聊聊AR8035的硬复位与软复位
  • Windows Defender Remover终极指南:彻底解决“Device Guard Blocked“错误的3种方案
  • 方法概述,方法的其他形式,使用常见问题
  • 一文讲透必懂的RAG20个核心概念:从0到 1 学会
  • 从人的双眼到工程双目:双目立体视觉原理、同步方案与 2026 年算法突破
  • 盲盒潮玩一番赏小程序开发玩法分析:算法逻辑、功能架构与合规落地
  • Pandas 内存爆炸?用闭包无侵入监控函数耗时与占用
  • uBlock Origin终极指南:5分钟打造纯净无广告的浏览器体验
  • Spring Boo从“会用”到“精通”:Spring Boot 入门
  • 别再只调API了!用Keras从零复现Facenet人脸识别模型(附完整代码与CASIA-WebFace数据集处理)
  • 期货量化 wait_update 超时怎么办:天勤 TqTimeoutError 分级处理
  • C++ 编码规范
  • 2026年大客户营销咨询选购指南,品牌排名 - mypinpai
  • PPTist:5分钟打造专业演示文稿的终极免费在线PPT制作工具
  • Mac窗口置顶神器Topit:如何让重要窗口永远在最前方
  • 紧急预警:标注数据漂移正 silently 毁掉你的模型效果!——用AI工具构建动态标注质量监控仪表盘(Python+Prometheus实战)
  • 2026年酒泉驾考驾校价格比较:新亿阳驾校性价比高吗? - mypinpai
  • 教育AI整合进入“深水区”:2024Q2行业报告显示,仅17%机构实现L1-L4能力跃迁——你的团队处在哪一级?
  • AI内容工作流会成为品牌基础设施
  • 量化程序如何同时支持回测、模拟盘和实盘
  • 避坑指南:MATLAB读取MDF和BLF文件时,你可能会遇到的5个常见错误及解决方法