当前位置: 首页 > news >正文

华为云INSPIRE大会全解读:面向Agent时代的完整AI基础设施全家桶

文章目录

    • 前言
    • 一、算得快:AICS灵衢智算集群
      • 核心硬核指标
    • 二、记得住:AMS Agentic记忆存储
      • 产品核心优势
    • 三、调得动:CCE Volcano Next
    • 四、安全可靠:AgentSphere
      • 四层安全防护能力
    • 五、ModelArts Next:重新定义新一代MaaS平台
    • 六、智果园:面向硅基智能体的全新云原生入口
    • 七、行业AI梦工厂:打通Agent最后一公里落地通道
      • 7.1 智慧医疗专区
      • 7.2 CloudRobo具身智能平台
      • 7.3 科学计算专区
  • 总结

前言

近期AI行业迎来重磅事件:6月15日华为云上海INSPIRE创想者大会正式召开,本次发布会一次性推出多款适配Agent全生命周期的底层基础设施与上层平台产品。
当前企业落地智能体普遍存在四大痛点:推理响应慢、长上下文易遗忘、多任务算力资源争抢、自主操作存在数据安全隐患。多数开发者会误以为更换更大参数底座模型就能解决问题,实则根源在于传统软硬件架构并非为Agent多轮连续决策、长期任务运行场景设计。

本次华为云发布四大底层核心产品,分别对应算力、记忆、调度、安全四大刚需,搭配MaaS开发平台、硅基智能体云入口、垂直行业落地工具链,形成一套端到端Agent落地解决方案,下文分层拆解各产品核心能力与行业价值。

一、算得快:AICS灵衢智算集群

大模型单次对话推理与Agent多步骤链式推理的算力、Token吞吐需求存在量级差距,通用推理集群无法承载智能体高频、连续、低延迟决策场景,AICS灵衢智算集群针对性补齐算力短板。

核心硬核指标

  • 推理端到端时延控制至10ms以内,满足实时交互Agent需求
  • 集群最大支持10万卡级规模化部署,总算力可达200 EFLOPS
  • 千卡集群每秒Token吞吐500万,高并发场景承载能力拉满
  • 在线推理服务稳定可用度99.95%,保障企业7×24小时业务运行

十万卡级超大规模集群同时兼顾低时延与高吞吐,是国产智算云标杆级能力,为复杂多智能体协同、高并发企业服务提供底层算力底座。

二、记得住:AMS Agentic记忆存储

长会话、跨天连续业务场景下,普通大模型会话上下文窗口有限,智能体极易丢失历史信息,无法沉淀用户偏好、业务历史经验,是企业级Agent落地最大卡点之一,AMS专为智能体打造分层长期记忆系统。

产品核心优势

  1. 存储规模:支持PB级超大记忆存储空间,容量规模领先业界一倍
  2. 读写性能:盘级全新存储架构搭配三合一专用芯片,实现TB级高速读取
  3. 综合性能:整体读写、检索性能超越同类产品50%
  4. 缓存优化:DRAM内存池化分层联动设计,记忆缓存命中率高达95%

简单来说,AMS相当于给智能体搭载永久长期记忆,即便持续运行数天的长流程业务,Agent也能精准调取数日前的对话、业务数据,彻底解决智能体“失忆”难题。

三、调得动:CCE Volcano Next

企业AI业务往往同步运行模型训练、在线推理、智能体任务执行、海量存储读写等多种负载,CPU、NPU、网络、存储资源容易出现抢占冲突,造成资源浪费、任务排队卡顿。

CCE Volcano Next作为统一资源调度引擎,承担算力资源“交通调度中枢”角色,打通通用计算、智能计算、分布式存储资源协同调度,实现多负载隔离运行、硬件资源弹性共享。
落地实测数据显示,接入调度引擎后,企业集群整体资源利用率提升30%,直接降低硬件采购与云端使用成本。

四、安全可靠:AgentSphere

通用对话模型仅做信息输出,而Agent具备工具调用、数据修改、跨系统操作能力,随之带来越权操作、核心数据泄露、操作行为无法溯源、恶意指令执行等多重安全风险。AgentSphere为智能体构建独立安全运行沙箱,全链路管控行为风险。

四层安全防护能力

  • 内核级隔离沙箱,隔绝智能体与底层服务器敏感资源
  • 双向网络访问拦截,限制Agent非法外联、内网越界访问
  • 会话级精细化权限管控,按需开放操作权限
  • 实时恶意意图识别拦截,提前阻断风险指令

同时兼顾轻量化性能:沙箱毫秒级启动,单集群每分钟支持十万级沙箱创建销毁,安全能力不损耗业务并发性能。

五、ModelArts Next:重新定义新一代MaaS平台

四大底层基础设施之外,华为云同步升级平台层产品ModelArts Next,打破传统单一API调用式MaaS局限,面向Agent全流程开发提供一体化能力矩阵,四大核心能力覆盖模型选用、调度、数据安全、持续进化全流程:

  1. 全品类模型矩阵
    DeepSeek、Kimi、GLM等主流开源/商用模型上线即支持接入,解决企业多模型选型、快速集成需求。
  2. 智能模型路由
    内置三类自适应调度策略,任务匹配精准度超95%,自动分配最优底座,平均降低模型调用成本20%以上。
  3. 硬件级机密推理
    依托芯片TEE可信执行环境,用户原始数据推理完成自动销毁,云平台运维人员无权限读取明文数据,解决金融、政务等高敏感场景数据顾虑。
  4. RLaaS强化学习服务
    一键创建强化学习训练任务,支持最长10天不间断稳定训练;云南交投落地实践中,依托该能力交通流量预测模型精度提升约10%,实现Agent业务持续迭代优化。

六、智果园:面向硅基智能体的全新云原生入口

本次发布会前瞻性推出全新产品智果园,跳出“人操作云平台”的传统设计思路,预判未来云资源使用者将从人类转向各类Agent智能体。

过往企业部署集群、调整算力、配置服务、运维资源,均需要人工操作控制台、调用API或执行命令行;智果园提供自然语言交互入口,仅需通过对话输入业务目标,智能体可自主完成资源采购、环境搭建、应用部署、日常运维全流程操作。
该产品重构云平台交互模式,云基础设施正式具备被硅基智能体自主调用、管理的能力,是面向Agent时代极具前瞻性的产品设计。

七、行业AI梦工厂:打通Agent最后一公里落地通道

算力、存储、调度、安全、开发平台底座全部完善后,垂直行业落地工具链决定智能体能否规模化商用。华为云推出“行业AI梦工厂”,开放多年沉淀的行业数据集、专用工具链、落地实践方案,降低各领域开发者Agent开发门槛,目前三大核心专区已对外开放:

7.1 智慧医疗专区

适配各级医疗机构,主推少样本轻量化病理AI方案:普通办公消费级PC即可完成专属病理模型推理,训练所需标注数据仅为传统方案十分之一;现已规模化落地全国三甲、市级、县域多层级医院,赋能基层医疗AI诊断。

7.2 CloudRobo具身智能平台

全球首个全链路机器人开发一站式平台,覆盖数据生产、模型训练、仿真测试、真机部署完整流程;自研双系统VLA视觉力控模型,主动预测、精准控制能力达到行业SOTA水准。

7.3 科学计算专区

聚焦AI4S科研赛道,面向生命科学、材料化学、气象海洋等科研场景,提供高性能算力与专用AI科研工具,加速科研领域模型研发与仿真计算。

总结

本次华为云发布会并非零散新品迭代,而是覆盖底层算力、记忆存储、资源调度、安全隔离、开发MaaS平台、智能体云入口、垂直行业落地的全栈Agent基础设施解决方案,系统性解决当前智能体落地全链路卡点。

整套方案中两大创新方向最具长期行业价值:

  1. AMS Agentic记忆存储
    智能体长期记忆缺失是企业复杂业务落地的核心瓶颈,PB级大容量存储+95%缓存命中率的分层记忆架构,能够支撑跨天、跨流程长任务稳定运行,有望大幅拓宽Agent在企业核心业务场景的使用边界。
  2. 智果园硅基云入口
    打破人类操作云资源的固有模式,实现Agent自主管理云基础设施,属于行业超前布局,未来开发者无需掌握复杂云运维知识,依靠自然语言即可通过智能体完成全部集群搭建与运维工作。

你认为当前制约企业级Agent大规模落地的核心障碍是什么?对于Agent专用底层算力、记忆存储、智能云入口这类基础设施,有哪些看法欢迎评论区交流讨论。

http://www.zskr.cn/news/1538080.html

相关文章:

  • QQ机器人-Astrbot搭配NapCat框架插件文件发送问题 - windows99
  • 2026福州大平层装修公司哪家靠谱?最新排行榜与避坑指南 - 资讯快报
  • Python ezdxf:7天掌握DXF文件处理的完整指南
  • 3个技术突破:Path of Building PoE2如何解决流放之路2角色构建的复杂性问题
  • 面试逆袭攻略:Java面试常见陷阱与应对策略
  • 单词背了很多,英文文章还是读不懂?
  • AI落地三重刻度:业务偏移、人力节省与自主迭代
  • CARLA四大交通模拟模块原理与协同实战指南
  • 告别手速焦虑:大麦自动抢票工具终极指南,轻松获取心仪演出门票
  • 熵码匠艺:用熵减思维重构代码质量与长期可维护性
  • LLM六维能力评估体系:面向真实业务场景的可落地压力测试
  • C#字符串内存分配与驻留池原理实战
  • Input Leap终极教程:如何用一套键盘鼠标控制多台电脑
  • 深入解析NXP PXS20 MCU:SSCM系统配置与STM定时器实战指南
  • 光电效应实验避坑指南:暗电流、本底电流和遏止电压,新手最容易搞错的三个点
  • 北京周边上门回收邮票纪念币,整册邮品工艺品当场结算 - 深鉴新闻
  • 软解析器自定义协议开发指南:从XML配置到网络数据包解析实战
  • 中国 PG 在全球排第几?这场直播给出了答案
  • 洛阳三家老牌清真涮牛肚门店实地对比测评 - 资讯快报
  • 《Python程序设计》实验四实验报告
  • 约瑟夫环的面向对象实现:用Circle、Person与Rule重构经典问题
  • OpenCore Legacy Patcher完整教程:4步让老旧Mac完美运行最新macOS
  • 2026沈阳搬家怎么选?5家专业机构并列实测推荐 - 幸福生活序曲
  • 中山二手手机哪家强?2026年推荐榜top7实践经验分享 - 资讯快报
  • 2026 成都靠谱的本地装修公司,成都十大本土家装品牌榜单 - 推荐官
  • 2026 南京市全域屋面防水 / SBS 卷材防水 / 彩钢瓦防腐翻新正规企业排行榜|5 家合规单位精选 + 本地避坑全攻略 - 资讯快报
  • Llama4 Maverick与Scout:多模态大模型的场景化架构分叉解析
  • 深度拆解津达线缆:从铜材加工到十年质保的全产业链实力盘点 - 资讯快报
  • 2026 福州老房卫生间渗水如何修复?调研 5 家靠谱本地防水施工单位优缺点 - 防水资讯
  • MetaWeblog API 发布测试2