当前位置: 首页 > news >正文

PriLLM: 为LLM服务实时定价的 Stackelberg Game 建模 【School of CS and Eng,Southeast University】

原论文:

Pricing Online LLM Services with Data-Calibrated Stackelberg Routing Game

https://arxiv.org/pdf/2511.09062

#NashEquilibrium #routing #ProfitCurve #KKT #MPEC

PriLLM是一个为LLM服务商设计的实时定价模型。作为一个经济模型,PriLLM有一个比较宏大的世界观,不但包含Nash Equilibrium的推演,更有对 profit curve 的智能简化功能。当服务商定好价格,用户根据自己的偏好决定购买量,模型把这个过程对比实际数据调整参数。根据新的市场态势(是个NE),服务商对友商进行排序,并虚拟所有尾部友商为一整体,用这个简化的市场模型快速给出价格。而后台会进一步对比简化前后的模型,打磨参数。从数学角度上讲,这个模型的很多部分都是NP-hard的MPEC问题。

这个模型的底层逻辑是一个Stackelberg routing game : leader是服务商,先定下价格;follower是用户,把消费值分配给市场上多个服务商。很直观性的,用户会通过决定在不同APP上的消费fij来最小化自己的cost,包括的因素有p价格,d延迟,b品牌价值,还有Q也就是服务商当前订单量比上他的服务上限α。本文的每个“用户”实际上都是按照APP使用偏好集合出的群体,另外作者还简单证明了所有的 cost functions 集合在一起可以求出一个 Nash Equilibrium,把这个解叫做F*。而服务商在定价的时候,Qj=ifij/αj,然后他最大化他的盈利。把这个底层设定总结成公式就是:

PriLLM在计算用户端 Nash Equilibrium 时会和真实市场数据拟合。这一步就是最小化模型求出的F*和实际数据间的距离。而在求导NE时,作者们用了与 (1)&(2) 同解的 potential function ,包含带有用户偏好因素的ΦFixedF以及和拥塞有关的ΦCongestionF。这里的解F*符合 Karush-Kuhn-Tucker (KKT) conditions 。具体Φ的公式如下:

而在商家定价这个环节,作者们把友商信息简化出一个集成度更高的模型,定价时只用这个简化的模型;然后后台会进行一系列拟合去更新 profit curve 。这里用到了 deep aggregation network ;简略地给当前每个友商打个分,再把排到第K位和之后的友商放在一起看作是一整个友商。每个友商表示成一个矢量,并根据这些数据给出总和性与平均性的打分;而对于本商家s,则是估算他的 profit curve。根据模型参数算出不同价位的利润值预期,再把用整个模型和简化模型得到的两条 profit curves 进行拟合,以减小这个简化过程的失真性。

在试验数据中,PriLLM展现出了在数据量较少情况下的学习能力。而模型对b参数和Q参数的利用也明显提升了预测准确性。Profit curve 的简化功能提升了模型效率。在 K=1 时模型已经可以模拟出90%以上的利润,而当K>2时运算时间还是成倍增长;而作者也提到多市场参与者前提是他们下一步的一个方向。

http://www.zskr.cn/news/1418585.html

相关文章:

  • 别再只会拖Button了!用Python脚本+Unity UGUI EventSystem,5分钟自动化测试你的UI交互
  • OpenCV 4.x时代,如何用ORB替代SIFT搞定Python图像拼接(附完整代码)
  • 避坑指南:Unity ShaderGraph制作透明火焰效果时,Alpha混合和Surface设置的那些坑
  • 别再死记硬背了!用Python实战模拟四种循环(简单/嵌套/连锁/非结构)的测试用例设计
  • 亚控组态报表数据导出Excel后,如何用VBA实现自动汇总与图表生成?
  • 技术美术进阶:三方向映射纹理的“坑”与优化技巧(从UE4到Unity的避坑指南)
  • 保姆级教程:理光喷头UV打印机白墨与光油通道设置实战(以1H2C_4C+2WV为例)
  • Oracle数据清洗实战:用正则表达式搞定脏数据,附赠常用SQL模板
  • Yolov8全系列模型C#推理性能优化:TensorRT vs. OpenVINO C# API对比实测
  • 工业网关实战:基于神州龙芯GSC3290双网口与YT8521S的稳定网络方案设计与调试心得
  • RuoYi-Vue + PostgreSQL实战:除了改驱动和URL,这些配置细节你调对了吗?
  • 手把手教你用Vivado 2019.1配置Tri Mode Ethernet MAC,搞定FPGA与RTL8211E的千兆UDP通信
  • 别再手动折腾了!用Composer和PECL一键搞定PHPStudy的imagick扩展(附PHP7.3/7.4版本适配指南)
  • 告别偏色!手把手教你用i1Profiler 3.5为打印机制作精准ICC曲线(附D50/D65光源选择指南)
  • AI搜索变天后,最先掉队的不是小网站,而是还没搞懂向量引擎的人
  • 从Photoshop到Word:拆解那些‘小而美’的工具栏按钮,用Qt的QToolButton轻松复现
  • 告别网页登录!用OpenWrt路由器+sdusrun脚本自动搞定深澜校园网认证(保姆级教程)
  • 为AI编程助手构建自动化工作流:规则、命令与钩子实践
  • 告别Gym!手把手教你用Pipenv搞定Gymnasium+Atari环境(附版本变化避坑指南)
  • 别只pip install了!从源码编译pycocotools,彻底搞懂它和COCO API的关系
  • Taotoken 用量看板与成本管理功能如何帮助团队控制预算
  • 从零搭建移动机器人视觉里程计:基于D435i和VINS-Fusion的实战配置与调参心得
  • 别再折腾了!Windows下用WVP-Pro+ZLM搭建国标监控平台,保姆级避坑指南
  • 用 Nerfstudio 和你的手机照片,5分钟快速生成一个3D数字手办(完整流程)
  • 告别‘天书’:手把手教你读懂IGS产品长文件名(V2.0版详解)
  • 告别Keil?我用STM32CubeIDE从新建工程到代码烧录的全流程实战(附串口烧录技巧)
  • 告别信号卡顿!5G手机切换基站时,后台到底在忙些啥?(附A3/A5事件参数详解)
  • 别再死记公式了!用LTspice仿真带你直观理解带隙基准电压源(Bandgap Reference)
  • 大模型知识蒸馏技术深度解析:从 Teacher-Student 到 Reverse KL 的模型压缩原理
  • STM32 FSMC驱动8080屏:从硬件接线到地址计算,一份给“强迫症”工程师的终极配置清单