Azure OpenAI 告警分析与处理指南

Azure OpenAI 告警分析与处理指南

一、告警类型概览

类型指标含义严重程度
429AzureOpenAIRequests (StatusCode=429)请求被限流
5xxAzureOpenAIRequests (StatusCode=5xx)服务端错误
TokenTotalTokensToken 用量过高
LatencyAzureOpenAITimeToResponse响应延迟过高

二、429 限流告警

告警示例

规则: openai-gpt4-429 级别: 🟠高 状态: 🔥触发 指标: AzureOpenAIRequests: 150 (阈值>100) 描述: gpt-4 部署 429