当前位置: 首页 > news >正文

每日 AI 评测速递来啦(12.23)

司南·Daily Benchmark 专区今日上新!

SGI-Bench

一个面向科学通用智能的评测基准,由 1,000 余个经专家精心策划的跨学科样本构成,灵感来源于《Science》杂志提出的 125 个重大科学问题。

https://hub.opencompass.org.cn/daily-benchmark-detail/2512%2016969

3SGen-Bench

一个统一的图像驱动生成评测基准,提供标准化指标用于评估跨任务的生成保真度与可控性。

https://hub.opencompass.org.cn/daily-benchmark-detail/2512%2019271

LGBench

一个面向长篇、多目标图像生成任务的评测基准,包含 2,000 个任务,用于系统评估模型在复杂布局、局部对象、排版和标志精度等多目标指令下的执行能力。

https://hub.opencompass.org.cn/daily-benchmark-detail/2512%2019243

http://www.zskr.cn/news/143756.html

相关文章:

  • 看着Uniswap的曲线,你想过自己做Swap吗?
  • 【轴承故障诊断】带频率稀疏学习的轴承故障诊断【含Matlab源码 14763期】
  • 鸿蒙学习实战之路-弹性布局 Flex 全攻略
  • TypeScript 与后端开发Node.js - 实践
  • 大一新手不知道做什么?一个Arduino 闪烁LED红绿灯震惊全班同学!
  • 121. 买卖股票的最佳时机
  • 当中断绑核遇上大模型推理:HostBound 问题优化全解析(昇腾深度实战版)
  • Axelspace与Exolaunch签署多批次发射安排协议并计划发射新卫星
  • 易路iBuilder: 独立业务智能体平台,企业无需更换系统,快速构建AI就绪型组织
  • 鸿蒙学习实战之路-相对布局 RelativeContainer 全攻略
  • web端使用roslib.js-ros2djs-ros3djs实现ros机器人在网页端可视化
  • 企业高效定位高潜客户的技术路径与实践方法论
  • 鸿蒙学习实战之路-HarmonyOS 资源分类与访问指南
  • 2025 年山东威海鱼竿生产厂家实力盘点:威海鱼竿生产厂家实力剖析 - 品牌2026
  • CAXA CAD让设计变更评审会不再扯皮
  • 鸿蒙学习实战之路-RelativeLayout相对布局全攻略
  • Harmony之路:实战起航(二)——数据模型与业务逻辑封装
  • 国内仿真云平台哪家强?该如何选择?
  • 10 个AI写作工具,助继续教育学生轻松写论文!
  • 新生态・新动能:人工智能产业格局分析
  • Harmony学习之安全与隐私保护
  • 精密仪器中的微型导轨如何选对润滑脂?
  • Harmony学习之多设备适配
  • 旧文章自动更新发布时间伪装成新内容|会被谷歌惩罚吗?
  • 构建系统(Colcon)依赖管理(Rosdep)
  • 如何选择德诺超声波焊接机才合适?
  • 国内有没有好的国产PaaS平台?
  • 大模型微调7种方法:零基础入门全指南
  • Harmony学习之声明式UI开发
  • 【C++】2.3 二叉搜索树的实现(附代码)