当前位置: 首页 > news >正文

Minimax WebSocket TTS 文档里 bitrate / sample_rate 的真实取值

结论:MiniMax 不支持bitrate=24000,但支持sample_rate=24000

你这里的“24K”要分清两个概念:

参数含义MiniMax 是否支持 24K
bitrate=2400024 kbps 码率不支持
sample_rate=2400024 kHz 采样率支持

MiniMax 官方参数里,sample_rate支持[8000, 16000, 22050, 24000, 32000, 44100],但bitrate只支持[32000, 64000, 128000, 256000],并且bitrate只对mp3生效。WebSocket 示例里也是sample_rate: 32000bitrate: 128000format: mp3。(MiniMax API Docs)

xiaozhi-esp32-server里说的 24K,本质上是24 kHz 采样率的 Opus 音频,不是 MiniMax 输出 24 kbps。项目默认协议配置是:

xiaozhi: audio_params: format: opus sample_rate: 24000 channels: 1 frame_duration: 60

也就是设备端收的是Opus / 24kHz / 单声道 / 60ms帧。(GitHub)

具体到 MiniMax TTS 实现,项目里的minimax_httpstream.py默认设置是:

"sample_rate": 24000, "bitrate": 128000, "format": "pcm", "channel": 1

注意这里是format: pcm,不是mp3,所以bitrate实际不是关键参数;关键是sample_rate=24000。项目还会在打开音频通道时把 MiniMax 的sample_rate更新为连接里的conn.sample_rate。(GitHub)

它的实际链路是:

文本 ↓ MiniMax TTS ↓ 输出 24kHz PCM ↓ xiaozhi-esp32-server 收到 PCM hex ↓ 服务器端重新编码为 Opus ↓ 发送给 ESP32

代码里可以看到,它从 MiniMax 返回数据里取audio_hex,转成 PCM bytes,然后调用opus_encoder.encode_pcm_to_opus_stream()编成 Opus 发给设备。父类也会按conn.sample_rate创建 Opus 编码器。(GitHub)

所以你要这样理解:

MiniMax 不支持 24kbps MP3 但 MiniMax 支持 24kHz PCM xiaozhi 项目再把 24kHz PCM 转成 24kHz Opus

建议 MiniMax 配置保持这样:

"audio_setting": { "sample_rate": 24000, "bitrate": 128000, "format": "pcm", "channel": 1 }

不要写:

"bitrate": 24000

如果你最终想控制的是网络传输码率 24kbps 左右,应该改的是Opus 编码器码率参数,不是 MiniMax 的bitrate。MiniMax 这边只负责输出 24kHz PCM,后面压缩率由服务器 Opus 编码决定。

http://www.zskr.cn/news/1345334.html

相关文章:

  • 2026沈阳钻石变现好去处,多家正规门店实力客观对比 - 李宏哲1
  • 告别手动对照!用OrCAD Design Sync功能,5分钟自动化同步你的原理图与Allegro PCB变更
  • 如何用Python自动化脚本高效抢购热门演出门票?智能抢票解决方案揭秘
  • U8 ERP接口二次封装实战:用Net4.8+WebAPI打造比OpenAPI更香的内网集成方案
  • 广东鸿胜金属设备回收:汕头废旧金属回收排名哪家好 - LYL仔仔
  • 2026年无锡黄金变现去哪?这 5 家正规回收店,手镯项链金条都收 - 奢侈品回收测评
  • 蛋白质结构预测模型的量化优化与硬件加速
  • 如何快速使用R3nzSkin国服换肤工具:免费解锁英雄联盟全皮肤终极教程
  • 从‘废弃信号’到规范DBC:避坑指南教你清理Vector CANdb++自动生成的0xC0000000报文
  • 【深度洞察】2026年制造业招投标智能化全流程的最新发展趋势?企业级Agent解决方案全解析
  • 5CGTFD7D5F27C7N、支持550MHz全局时钟与287MHz DSP处理的高性能FPGA
  • Java小白也能看懂!用100行代码手写Self-Attention,收藏这份AI进阶指南
  • 5月最新10款降AI神器实测:哪个能降知网维普AI率,从99.5%降至3.8%可信吗?
  • 八大网盘直链解析神器:如何彻底告别下载限速的终极指南
  • 如何用 “STAR 法则” 写项目经验,让 HR 眼前一亮
  • 别再手动调图了!用LaTeX的subcaption包搞定论文子图排版(附完整代码)
  • Agent Skills 万千应用 · 第04篇 Excel 分析 Skill:让 Agent 会整理表格、建公式、画图表
  • UE5性能优化实战:从RenderDoc截图到GPU瓶颈定位,手把手教你分析并解决卡顿
  • 在OpenClaw项目中配置Taotoken作为统一的AI能力提供方
  • 在OpenClaw项目中配置Taotoken作为统一的AI能力提供方
  • 东莞热门中央空调门店排行:品牌资质与服务能力对比 - 奔跑123
  • JSON数据处理难点解析与实战案例
  • UE5 Niagara实战:用网格体渲染器模拟碎片爆炸,从参数调节到性能优化全流程
  • 终极免费游戏串流方案:5分钟搭建你的私人云游戏服务器
  • Awoo Installer终极指南:3种方法快速安装Switch游戏的完整教程
  • 3步掌握GitHub文件精准下载技巧:DownGit完全指南
  • 7步掌握思源宋体TTF:从零基础到专业应用全攻略
  • 书匠策AI:你的论文过不了关?http://www.shujiangce.com这套组合拳直接救场!
  • 如何快速配置OBS Source Record插件:5个步骤实现多源独立录制的终极指南
  • 别再只会用mid()了!QT开发中QByteArray截取数据的3个隐藏技巧与实战避坑