当前位置: 首页 > news >正文

OpenAI大神教你如何榨干Codex

闻乐 发自 凹非寺量子位 | 公众号 QbitAI新晋员工确实毫无保留。Jason Liu13k星开源库Instructor的作者刚被OpenAI招进Codex团队没多久不仅在社交平台大方发API额度还写了篇Codex-maxxing把自己的Codex玩法全抖出来了。而且是让Codex自动跟进亚马逊退款、定时扫Slack接需求、开着Heartbeats在你洗澡的时候帮你干活的那种。Codex周活用户4月底已经破了400万终于来了份“官方使用指南”。正好这两天Codex又更新了一波Appshots截图直喂、Goal模式正式转正、锁屏后也能远程干活。跟Jason的使用心法叠在一起看会发现现在大家比拼的是谁能持续工作更久谁能真正上岗了……让它自己跑起来Jason整套玩法的核心是把Codex改造成了一个能长期运行、持续接管任务的工作系统。多数人习惯单次问答结束就关闭会话但Jason是开着一堆跨月存活的巨型线程不会随意终止。他给每个工作流一个置顶线程管日程的一个、管开源项目的一个、监控社交平台的一个……通过Command-1到Command-9一键跳转。线程里积累了几个月的对话历史、偏好和决策再次使用时不用重新交代背景Agent就能自动承接进度。当线程生命周期被拉长后项目背景、沟通习惯和历史决策都会自然沉淀进去Agent开始具备连续性。而且Jason下任务不打字主要靠说。在他看来口述能完整保留原始思路不需要刻意优化Prompt可以直接把模糊、跳跃、带溯源需求的想法原样丢给Agent。再配合Codex的Steering功能还能在Agent执行任务时插队追加指令说完就走不用干等。不过真正让Codex从工具变员工的是Heartbeatscomputer这套组合拳。Heartbeats本质上相当于给Agent加了一层定时任务调度。Jason有个Chief of Staff线程每30分钟跑一次——扫一遍Slack和Gmail看看有没有需要回复的消息判断优先级需要回复的先起草一份草稿但不发送最终由人来决定是否发出。他还举了一个更复杂的例子是做动画项目时他会先把视频发到Slack审阅线程然后让Codex每15分钟检查一次线程。如果同事提了反馈Codex就重新渲染一个新版本并回复到线程里。因为Slack MCP服务器还不支持文件上传Agent甚至会自己调用computer去点“Add file”按钮把渲染好的文件传上去。还有一次Jason在洗澡前让Codex盯着亚马逊客服排队状态结果等他洗完澡出来退款已经到账了。类似的流程现在已经能扩展到Google Docs评论、GitHub PR Review等场景只要有反馈就自动推进下一步。Jason最强调的一点是验证机制可以判断任务什么时候终止。他试过让Codex把Python的Rich库完整迁移到Rust硬性要求是必须通过原Python库的所有单元测试。测试能不能通过决定了任务是否完成失败了Agent就继续修。用他的话说没有验证机制的野心顶多算个愿望而已。而在最新的这次更新中OpenAI已经把Goal模式从实验版本转正了。你只要明确一个最终目标和验收标准Codex会自主持续推进短则几小时长则数天中途可以查进度、调方向也可以直接暂停。但前提是任务本身必须存在清晰、可验证的反馈闭环。记忆放在自己手里Jason这套用法的另一大核心思路是个人工作记忆不应该托管在平台内部。他所有的长期线程都从一个Obsidian vault起步目录划分为TODO、people、projects、agent、notes等板块。在顶层AGENTS.md里写明规则人员信息更新、项目推进、待办办结等变动都要同步更新知识库对应内容。也就是说他几乎放弃了Codex的内置记忆系统把核心记忆数据存放在本地可控文件中既能随时查阅手动修改也能通过版本对比查看变动出现问题还能一键roll back。原因是AI承载的记忆体量越大就越不该把数据锁死在单一平台。而文件是完全属于用户自己的后续想换工具、迁平台拎着知识库就能走毫无顾虑。他也提到了Codex自带的记忆功能Chronicle通过截取屏幕内容来构建上下文。但这是需要手动开启的实验预览功能在权限、速率和隐私方面存仍在短板整体方向可行但还不够成熟。所以在他看来文件系统仍然是最可靠的记忆基础设施。而且Codex工作台本身也在升级。Codex的侧边栏不再局限聊天交互可直接渲染Markdown、筛选表格、阅览PDF与PPT。Agent还能通过内置浏览器用JavaScript控制网页用户可以边看边标注不用来回切窗口。Jason说他经常在侧边面板里同时打开Storybook审阅UI组件、用Remotion Studio做动画、用Slidev做演示文稿。而他最喜欢的交付形式就是一个带JS和CSS的单文件index.html不用部署不用服务器打开就能跑。另外他还把Connectors和Skills作为可复用工作流模版。只要成功做完一件有用的事就把流程打包起来下次Codex不用重新学直接调用就行。最近Codex还补了一手远程能力电脑锁屏后Codex可以继续工作手机端也能实时查看、审批甚至接管任务。现在好了你下班它加班你锁屏它干活超额KPI这不就来了……不过当AI可以持续接管工作人自己倒是越来越轻松了doge。参考链接https://x.com/jxnlco/status/2057153744630890620一键三连「点赞」「转发」「小心心」欢迎在评论区留下你的想法—完—专属AI产品从业者的实名社群只聊AI产品最落地的真问题扫码添加小助手发送「姓名公司职位」申请入群进群后你将直接获得 最新最专业的AI产品信息及分析 不定期发放的热门产品内测码 内部专属内容与专业讨论 点亮星标 科技前沿进展每日见
http://www.zskr.cn/news/1365445.html

相关文章:

  • 机器学习与数据中心能耗测量:从原理到实践的全链路指南
  • OAuth 2.0 中的state参数:从规范到实践的深度解析
  • 会话蒸馏实战指南:10万字对话压缩到1%的5步技巧
  • 算法公平性评估:如何用自洽性与方差分析区分真实偏见与随机噪声
  • 模型不确定性下的公平性评估:自一致性指标与集成弃权策略
  • 如何快速提升电脑性能:5个终极系统调优技巧指南
  • MusicFree插件系统:突破性开源音乐聚合解决方案
  • 深度伪造的艺术革命:roop-unleashed如何重塑AI换脸技术边界
  • 基于深度学习猜拳识别 yolo11猜拳识别
  • 如何让老款Mac焕发新生:OpenCore Legacy Patcher终极适配指南
  • 中国车牌生成器技术深度解析:从算法原理到AI数据增强实战
  • 网盘下载新革命:LinkSwift直链助手让你的下载速度飞起来
  • BabelDOC:解决学术文档翻译三大痛点的智能PDF翻译工具
  • 如何通过Thorium浏览器实现3倍启动速度与40%内存节省:终极Chromium性能优化指南
  • 企业级微信网页版解决方案:wechat-need-web插件架构深度解析与高效配置指南
  • 3个维度解析:如何实现Windows进程内存的精准操控?
  • 机器学习模型遗忘技术:基于伦理均方误差的算法原理与工程实践
  • Thorium浏览器:基于Chromium的终极性能优化与隐私保护深度解析
  • AI智能体开发(三):实战构建研究助手Agent
  • 为什么92%的AI教育项目半年内停滞?PlayAI成功项目的4个反直觉设计原则与21项可复用配置清单
  • 量子机器学习可解释性:从经典XAI到XQML的挑战与创新方法
  • 拯救者Y7000P黑苹果避坑实录:搞定三星PM981和亮度调节,保姆级教程
  • 魔兽争霸3终极性能提升插件:5分钟实现现代系统完美兼容
  • Claude医学文献分析准确率实测:对比GPT-4o、Gemini 2.0与专业文献数据库(n=1,847篇RCT,Kappa=0.91)
  • 机器学习快速绘制自旋玻璃相图:从局部场统计特征到相分类
  • 速腾RS-M1激光雷达Windows点云查看保姆级教程:从接线到RSView实时显示
  • 机器学习结合对称性描述符高效预测硅带隙温度依赖性
  • DS4Windows终极指南:解锁PS4手柄在PC上的完整潜力
  • QMCDump:轻松解锁QQ音乐加密格式,实现音乐格式自由转换
  • 如何免费打造你的终极虚拟桌面伴侣:Mate Engine完全指南