当前位置: 首页 > news >正文

零 Token 消耗!Agnes 多模态 Agent 全栈实战指南

文生图 · 文生视频 · 智能 Agent 一站式接入,真正让 AI 落地工作流

前言:我为什么开始用 Agnes?

在折腾了一堆 AI 工具之后,我最大的痛点不是模型效果,而是——每次调用都在烧钱。输入 token、输出 token,还有各种隐性计费,一个稍微复杂点的 Agent 工作流跑下来,账单看得人心疼。

直到我发现了 Agnes,才算找到了真正能「无感」使用的 AI 平台。本文不是硬广,是我实际配置并跑通了图像生成、视频生成、多轮 Agent 对话之后,把整套流程整理出来分享给大家。如果你也在找一套零 token 消耗、功能完整的多模态 AI 解决方案,这篇可以直接当手册用。

一、Agnes 平台概览:三大核心模型

Agnes 目前对外提供三个主力模型,覆盖了日常 AI 工作流的主要场景:

  • Agnes2.0 Flash —— 智能 Agent 模型,支持工具调用、多轮对话、自定义知识库,适合构建自动化工作流
  • Agnes-Image-2.1-Flash —— 图像生成模型,文生图效果出色,支持风格定制,出图速度快
  • Agnes-Video-V2.0 —— 视频生成模型,支持文生视频,适合内容创作、产品演示等场景

💡重点:Agnes 平台的模型调用不消耗用户的 token 配额,按实际 API 请求计费,对于高频场景尤其友好。

二、注册账号并获取 API Key

整个接入流程非常标准,跟 OpenAI 的操作逻辑基本一致,熟悉的同学五分钟内可以跑通。

2.1 创建 API 密钥

登录 Agnes 平台后,进入「设置 → API 密钥」页面,点击「创建新的密钥」,为密钥命名(比如 test_01),保存后复制备用。

图1:Agnes 平台 API 密钥管理页面

注意密钥只在创建时完整显示一次,务必即时保存。后续列表中只展示前缀和后缀(如 sk-m9b5I...9Aobph)。

2.2 接口地址

Agnes 提供兼容 OpenAI 协议的 API,接口地址格式为:

https://api.agnes-ai.com/v1/chat/completions

三、将 Agnes 模型接入 WorkBuddy(以自定义模型为例)

Agnes 支持通过任何兼容 OpenAI 协议的客户端接入。下面以 WorkBuddy 为例,演示完整的配置流程。WorkBuddy 是目前体验较好的 AI 工作台之一,支持多模型切换、技能调用、Agent 工作流等功能。

3.1 打开「添加模型」配置弹窗

在 WorkBuddy 主界面底部工具栏,点击模型选择器 → 展开列表后,找到「+ 配置自定义模型」入口(见下图红色箭头标注)。

图2:WorkBuddy 模型选择器,底部有「+ 配置自定义模型」入口

3.2 填写配置信息

在弹出的「添加模型」对话框中,按如下内容填写各字段:

  • 提供商:选择「自定义 / Custom」
  • 接口地址:填入 Agnes API 地址
  • API Key:粘贴第二步中保存的密钥
  • 模型名称:根据需要填写,例如 agnes2-flash 或 agnes-image-2.1-flash

图3:WorkBuddy 添加自定义模型配置弹窗

高级配置中,建议勾选「工具调用」和「图片输入」,这样 Agnes2.0 Flash 的 Agent 能力和多模态输入都能正常使用。配置完成后点击「保存」即可。

四、实战一:Agnes-Image-2.1-Flash 文生图

Agnes 图像模型支持自然语言描述直接出图,接入 WorkBuddy 后,可以通过技能(Skill)调用的方式触发图像生成。

4.1 在 WorkBuddy 中触发图像生成

配置完成后,在对话框中使用 @agnes-image-api 技能,直接用中文描述你想要的画面,模型会自动理解并生成。

图4:WorkBuddy 中调用 agnes-image-api 技能,用自然语言生成图像

如上图,输入「我要猫咪在海边散步图片」,系统触发工具调用,Agnes-Image-2.1-Flash 完成图像生成。整个过程不需要编写任何 Prompt 模板。

4.2 生成效果示例

以下是 Agnes-Image-2.1-Flash 实际输出的图像效果(提示词:猫咪在海边散步,黄昏光线,写实风格):

图5:Agnes-Image-2.1-Flash 生成效果 —— 猫咪海边散步

画面细节丰富,光线处理自然,毛发质感和背景的海浪、贝壳都有较高的真实感,适合内容创作、社媒配图等场景。

五、实战二:Agnes2.0 Flash Agent 能力

Agnes2.0 Flash 的核心优势在于 Agent 工作流:支持多步骤工具调用、联网搜索、文件处理、自定义知识库等能力,适合构建自动化流程。

5.1 API 调用示例(Python)

下面是一个简单的 Python 示例,展示如何通过 API 调用 Agnes2.0 Flash 进行多轮对话:

import openai client = openai.OpenAI( api_key="sk-your-agnes-api-key", base_url="https://api.agnes-ai.com/v1" ) response = client.chat.completions.create( model="agnes2-flash", messages=[ {"role": "system", "content": "你是一个专业的数据分析助手"}, {"role": "user", "content": "请帮我分析这份销售数据的趋势"} ] ) print(response.choices[0].message.content)

💡Agnes2.0 Flash 完全兼容 OpenAI SDK,存量代码只需替换 api_key 和 base_url 两个参数,迁移成本极低。

5.2 工具调用(Function Calling)

Agnes2.0 Flash 支持标准的 tools 参数格式,可以接入自定义函数、数据库查询、外部 API 等工具。以下是定义工具的示例结构:

tools = [ { "type": "function", "function": { "name": "get_weather", "description": "获取指定城市的实时天气", "parameters": { "type": "object", "properties": { "city": {"type": "string", "description": "城市名称"} }, "required": ["city"] } } } ]

六、实战三:Agnes-Video-V2.0 文生视频

视频生成是 Agnes 平台近期推出的重量级功能。Agnes-Video-V2.0 支持通过文字描述直接生成短视频,适用于:

  • 产品功能演示视频
  • 社交媒体短视频内容
  • 教学/说明类动态图解
  • 创意广告素材生成

接入方式与图像模型相同,在 WorkBuddy 中配置模型名称为 agnes-video-v2 即可,或通过 API 直接调用:

response = client.chat.completions.create( model="agnes-video-v2", messages=[ {"role": "user", "content": "生成一段5秒的产品展示视频,科技感蓝色背景,3D旋转logo"} ] )

七、关于计费:不消耗 token 是什么意思?

很多同学对「不消耗 token」有疑惑,这里解释一下:

Agnes 平台的计费单位是 API 调用次数 / 请求量,而非按输入输出 token 数量计费。这意味着:

  • 无论你的输入内容有多长,不会因为「token超出」而产生额外费用
  • Agent 多轮对话中的上下文不会随着对话变长而指数级增加成本
  • 批量处理任务时,费用预估更稳定、更可控

💡对于需要频繁调用 AI 的自动化工作流来说,这种计费方式可以显著降低成本不确定性,便于做预算规划。

八、总结

折腾完这一套下来,Agnes 给我最大的感受是「接入成本低、功能覆盖全、计费逻辑清晰」。三个模型分工明确:

  • Agnes2.0 Flash:日常 Agent 任务、自动化工作流首选
  • Agnes-Image-2.1-Flash:快速出图、内容创作
  • Agnes-Video-V2.0:短视频素材生成

如果你正在搭建自己的 AI 工具链,或者想把 AI 能力嵌入到现有业务系统里,Agnes 是值得认真评估的选项。

有问题欢迎评论区交流,我会尽量回复。

— 本文仅供技术参考,如有更新请以官方文档为准 —

http://www.zskr.cn/news/1451094.html

相关文章:

  • 深岩银河存档编辑器完整教程:3步实现游戏进度自由调整
  • 三相正序理解
  • 深入拆解Xilinx CPRI IP的数据帧:10G速率下IQ数据与控制字如何复用通道?
  • 空间机械臂Simulink力位协同控制仿真套件(含刚柔耦合建模与闭环响应验证)
  • 2026年微型电主轴实测评测:浮动刀柄、自动换刀主轴、进口电主轴、钻孔动力头、风冷电主轴、高速电主轴、NAKANISHI研磨机选择指南 - 优质品牌商家
  • 滚珠花键预压过量,为何会出现高温抱死故障?
  • 别再只接3.3V和GND了!ESP8266-01S稳定供电与CH340G串口模块的正确接线方案
  • Suno-V3深度体验:除了‘听个响’,AI生成音乐在内容创作中的真实应用场景
  • Agent Harness架构:让AI Agent实现7×24小时无人值守运转
  • 学术答辩效率神器|百考通AI,一键搞定高质量答辩PPT
  • 终极指南:如何用G-Helper快速释放华硕笔记本全部潜能
  • 告别全局变量和锁:在LVGL项目里用Timer回调实现线程安全的状态刷新
  • UE4 Sequence实战:手把手教你用粒子特效打造酷炫的火焰激活动画(含摄像机追踪技巧)
  • 避坑指南:eCognition ESP2插件安装、配置与‘不出峰值’问题全解决
  • 「ECG信号处理——(33)基于LSTM-RNN的睡眠呼吸暂停检测」2026年06月02日
  • 告别小打小闹!用LargeST数据集(8600个传感器,5年数据)实战交通流量预测
  • 线上召回率暴跌?一次关于 Sentence Transformers 提示词注入绕过向量检索边界的惊险排查与防护
  • Flutter小程序跨端方案:打破技术边界实现代码复用新范式
  • 基于主成分分析(PCA)的EPFs(PCA-EPFs)方法在边缘保留特征在高光谱图像分类中的应用研究(Matlab代码实现)
  • PMBOK8新架构:绩效域取代过程组
  • AI 营销的核心不在种草,而在 GEO 构建的信任体系
  • Linux嵌入式SPI主从通信验证工程:C语言实现+spidev驱动调用+一键编译
  • 收藏!7个文理兼收的AI高薪岗位,小白也能轻松入门
  • 发票、合同、身份证——OCR在金融行业到底替代了多少人工
  • Mixly图形化编程一键接入Blinker物联网的点灯科技扩展包(含ESP32示例与完整开发文件)
  • 别再乱调参数了!OpenCV Canny边缘检测的threshold1和threshold2到底怎么设?附实战调参技巧
  • 别再只调PID了!用Mahony算法搞定MPU6050姿态解算(附Arduino代码)
  • AI工具付费决策全图谱,从LTV/CAC比值、API调用频次到企业级审计支持——技术负责人必读的5步评估法
  • 告别高斯噪声!手把手教你用DiGress在离散图上玩转扩散模型(附ICLR 2023论文解读)
  • 从FXML到EXE:手把手教你用SceneBuilder 21.0 + JDK 17打包独立JavaFX桌面应用(含资源路径避坑指南)