当前位置: 首页 > news >正文

港科大夏俊:肽串联质谱预测统一评估基准

摘要

串联质谱为复杂生物样本中蛋白质的高通量鉴定与定量提供了技术框架。在计算蛋白质组学中,肽段串联质谱(MS/MS)谱预测是核心任务,可支撑大规模肽段鉴定与定量等下游应用。尽管深度学习架构大幅提升了预测精度,但3类评估问题掩盖了该领域的真实进展:

❶ 不一致的数据预处理与不兼容的模型输出空间阻碍了模型的公平对比;

❷ 有缺陷的数据分割策略会引发隐匿的序列泄露,虚高模型性能;

❸ 现有评估通常缺乏全面的跨物种基准测试,也未系统评估模型对关键实验条件的鲁棒性。

为解决上述问题,本文提出肽段串联质谱谱预测统一基准PepSpecBench。该基准对多个互补公共数据集进行标准化数据预处理,采用严格的骨干不相交分割策略消除序列泄露,并在统一的碎片离子表征空间中评估各类架构;同时构建全面的多物种评估套件与基于物理原理的元数据扰动探针,用于评估模型鲁棒性与仪器感知能力。本研究揭示了6个代表性模型此前未被发现的性能差异与鲁棒性缺陷,为未来模型设计、评估与实际部署提供了可落地的参考。

https://huggingface.co/datasets/Chris-young-2004/PepSpecBench

junxia@hkust-gz.edu.cn

研究方法

任务与基准定义

表1本文所用基准组件的描述性统计

所有组件共享相同的肽段长度、电荷与翻译后修饰(PTM)范围;域内数据分别在同一单元格中报告训练/验证/测试集占比。

基线模型与空间对齐

图1PepSpecBench框架总览

该流程通过4个关键阶段系统性设计以确保公平且可诊断的评估:

(1) 标准化数据整合,在统一预处理框架下对齐PROSPECT与MassIVE-KB数据集;

(2) 防泄露数据划分,执行严格的骨干不相交分割策略;

(3) 规范化输出投影,将离散离子阶梯、连续全谱等各类模型预测结果对齐至统一表征空间;

(4) 全面鲁棒性评估,测试跨物种分布外泛化能力与物理敏感性。

实验结果

统一的物种内基准测试

表2统一规范空间下的物种内基准测试结果(骨干不相交分割,中位数)

每个数据源的最优结果加粗显示

数据泄露的影响

表3PROSPECT数据集上Prosit模型的分割消融指标(中位数)

差值为相对于骨干不相交分割的结果

跨物种泛化能力

表4跨物种泛化结果(主要分布外结果)

物种列数值为光谱角(SA)/光谱角相似度(SAS)中位数;每个物种的最优分布外结果加粗显示;大肠杆菌结果为2个数据源的聚合值。

肽段属性分析

图2多属性分析(前4个模型,统一规范空间)

行依次为PROSPECT数据集的光谱角(SA)、MassIVE-KB数据集的光谱角(SA)、PROSPECT数据集的皮尔逊相关系数(PCC)、MassIVE-KB数据集的皮尔逊相关系数(PCC);列依次为肽段长度、前体电荷、相对光谱角/皮尔逊相关系数随长度的衰减(基线为[6,10)区间);阴影区域为bootstrap置信区间。

物理参数敏感性

3物理参数敏感性:3组并行实验

(a) PROSPECT数据集上的归一化碰撞能量(NCE)校准分析:中位数光谱角随overriding NCE的变化;虚线为真实NCE=30。

(b) MassIVE-KB数据集上的盲法NCE扰动:NCE从25变为30时的光谱角变化值。

(c) PROSPECT迷你数据集上的电荷态扰动:前体电荷从2强制改为3时,光谱角相似度大于0.90的谱图占比。

详细总结

思维导图

3大不可忽视的评估缺陷

数据集构建

异构输出空间对齐

为6类代表性模型设计专属投影函数,将其原生输出统一映射至234维规范空间:

数据泄露:随机分割严重虚高性能

以Prosit在PROSPECT上的实验为例:

参考

PepSpecBench: A Unified Evaluation Benchmark for Peptide Tandem Mass Spectrometry Prediction

https://doi.org/10.48550/arXiv.2605.01945

260503PepSpecBench.pdf

注:AI辅助创作,如有不当欢迎指出。内容仅供参考,不构成任何建议。

http://www.zskr.cn/news/1433999.html

相关文章:

  • 为什么92%的市场人用错Gemini写文案?,深度解析提示词结构、品牌语调对齐与合规性红线
  • 2026年东营苏瀚装饰发展纪——实接轨省级行业标准,诚信服务立足本土 - GrowthUME
  • 2026年大型振动电机厂家怎么选?看懂这一篇就够了——深度推荐恒升振动电机 - GrowthUME
  • 别再让骰子散架了!用Python+Word批量生成3CM幼儿卡纸骰子(附完整代码与A4排版技巧)
  • 保姆级教程:用联想官方Recovery工具给旧电脑‘洗白’重装Win10/Win11
  • 2026年4月国内有实力的发电机直销工厂有哪些,发电机/发电机组,发电机源头厂家有哪些 - 品牌推荐师
  • 2026年AI论文写作软件深度评测:6款工具合规过检得分排名
  • 二手摩托车发动机烧机油怎么检测? - GrowthUME
  • 江苏成人高考靠谱机构排行 5家合规机构实测对比 - 奔跑123
  • 别再只会用GUI了!手把手教你用mongosh命令行搞定MongoDB日常运维(含连接、查询、聚合实战)
  • 歙县民宿哪家好?Top5榜单把评分、位置和性价比讲透 - GrowthUME
  • HBuilderX项目本地打包APK全流程:从SDK对接到Android Studio签名发布(含DCloud证书配置)
  • Unity 2022.3 导出 OBJ 模型到 Blender 3.6 的完整避坑指南(含坐标系、材质修复)
  • 主流变压器厂家综合排行 实测性能与服务维度对比 - 奔跑123
  • 告别混乱时间轴!UE4 Sequence多层级动画与粒子特效管理实战心得
  • 如何免费下载B站4K大会员视频:3步搞定B站视频下载完整指南
  • 无人机航拍人体检测数据集|低空巡检搜救智能监控|YOLO目标检测算法训练集
  • 告别网盘限速的终极方案:九大平台直链下载工具全面解析
  • 兰州地区电力工程企业综合实力排行及项目复盘 - 奔跑123
  • 如何免费突破网盘限速?九大主流网盘直链下载助手完整指南
  • ChatGPT自我检测AI生成文本:原理、实践与教学应用
  • Gemini为何突然新增斯瓦希里语、豪萨语、约鲁巴语?(非洲语言战略升级内参)
  • 基于ESP8266的智能家居提醒器:从电路设计到Home Assistant集成
  • 2026北京老家具回收机构综合实力TOP5排行(行业天花板维度) - 品牌排行榜单
  • Bard与ChatGPT深度对比:从模型基因到实战场景的AI工具选择指南
  • Gemini角色设定生成黄金公式:R²C³模型(Role-Reason-Constraint-Context-Consistency)首次公开
  • 2026年YZU系列振动电机高品质、高性价比品牌深度推荐:恒升YZU振动电机选型与优势全解析 - GrowthUME
  • VinXiangQi:如何用AI视觉识别技术打造智能象棋助手?
  • JiYuTrainer终极指南:极域电子教室控制解决方案完整教程
  • 争对错相比于权衡利弊