适用场景:AI Agent立项预算评审、试点上线成本风控、规模化扩量ROI评估、年度降本复盘
核心目的:杜绝「上线免费、越用越贵、算力爆炸、运维拖垮、有投入无产出」的落地翻车问题
判定规则:任意高危×不整改,禁止规模化推广;中危需制定压降方案;低危持续优化
一、直接算力成本风险(最显性、最容易失控)
序号 | 自查维度 | 风险点说明 | 风险等级 | 自查结果 | 整改/备注 |
|---|---|---|---|---|---|
1.1 | 单任务Token消耗测算 | 已精准测算Agent多轮思考+工具调用+知识库检索的完整Token消耗,而非仅按普通问答预估(Agent普遍是普通问答5–20倍消耗) | 高危 | ||
1.2 | 并发放量成本阈值 | 已设置日调用上限、并发限流、超额告警,避免业务放量后算力账单指数级暴涨 | 高危 | ||
1.3 | 多模型校验冗余成本 | 若使用红蓝校验、多模型择优、重跑复盘机制,已核算冗余算力成本,无无意识浪费 | 中危 | ||
1.4 | 无效调用成本管控 | 已拦截重复调用、空调用、失败重试滥用、无意义多轮思考,杜绝纯浪费算力 | 中危 |
二、人力与运维隐性成本风险(ROI最大隐形杀手)
序号 | 自查维度 | 风险点说明 | 风险等级 | 自查结果 | 整改/备注 |
|---|---|---|---|---|---|
2.1 | Prompt持续迭代成本 | 确认业务规则变更、场景扩容需要持续调优Prompt,已预留运维人力,不存在上线后无人维护导致效果崩盘 | 高危 | ||
2.2 | 知识库更新成本 | 政策、制度、产品话术、业务流程变更,有固定更新机制,避免知识库陈旧导致Agent失效、返工重做 | 中危 | ||
2.3 | 接口与系统适配成本 | 老旧系统、非标准化接口、脏数据适配改造成本已提前测算,无「集成成本远超预期」的烂尾风险 | 高危 | ||
2.4 | 故障复盘与纠错成本 | Agent幻觉、执行错误、流程翻车需要人工兜底复盘,已核算兜底人力成本,不算“零成本AI” | 中危 | ||
2.5 | 专属人才溢价成本 | 确认企业具备/可采购Agent编排、微调、运维能力,无高薪招人、外包天价落地的超额成本 | 中危 |
三、效率损耗与反向增收风险(假提效、真添乱)
序号 | 自查维度 | 风险点说明 | 风险等级 | 自查结果 | 整改/备注 |
|---|---|---|---|---|---|
3.1 | 人工复核额外成本 | Agent准确率不足时,员工需要二次校对、修正、纠错,出现「AI干活更慢、更累」的反向降效 | 高危 | ||
3.2 | 延迟导致的业务损耗 | Agent多轮推理延迟过高,导致客户等待、审批超时、业务卡顿,产生隐性营收损失 | 中危 | ||
3.3 | 错误执行业务损失 | 幻觉填错数据、错误审批、错误外发信息,带来客诉、赔付、返工、合规损失 | 高危 |
四、ROI产出与回本周期风险(能否赚钱、能否省钱)
序号 | 自查维度 | 风险点说明 | 风险等级 | 自查结果 | 整改/备注 |
|---|---|---|---|---|---|
4.1 | 量化收益指标明确 | 已明确具体收益:节省多少人天、降低多少差错率、缩短多少工时、提升多少转化,无模糊“提效”口号 | 高危 | ||
4.2 | 回本周期可控 | 整体投入(算力+人力+开发+运维)可在可控周期内回本,不存在长期净亏损项目 | 高危 | ||
4.3 | 场景适配收益真实 | 区分「Demo好看」和「生产有用」,当前落地场景确实高频、重复、标准化,适合Agent替代,无低频无效落地 | 高危 | ||
4.4 | 规模化边际成本下降 | 放量后可实现边际成本摊薄,不会用户越多、单客成本越高、ROI持续恶化 | 中危 |
五、ROI终审结论(立项/上线专用)
1. 禁止上线条件(满足任意一条直接否决)
高危风险存在未整改项
无量化收益、无明确回本周期
算力/运维成本无法可控,存在失控风险
场景低频、定制极重,规模化无法摊薄成本
2. 合格上线标准(必须全部满足)
全部高危风险清零
单任务成本、日均峰值成本、月度封顶成本清晰可控
人力运维成本可量化、可预算
提效/降本收益可量化,6–12个月可完成回本
3. 最终评审结果
整体风险评估:□ 低风险可上线 □ 中风险整改后上线 □ 高风险禁止上线
评审人:__________ 日期:__________