当前位置: 首页 > news >正文

Nex-N2重磅开源!具备“智能体思维”,性能直逼GPT-5.5,引领AI新纪元!

Nex-AGI 是由上海创智学院发起的创新联盟,旨在建设一个可持续的能动性闭环开源生态。近日,Nex-AGI 正式开源下一代模型 Nex-N2 —— 一款具备“智能体思维”的智能体模型,凭借一流的代码能力和智能体能力,能在真实环境中持续推进复杂、长周期的任务,稳定地交付端到端的结果。在多项权威基准上,Nex-N2-Pro 整体紧追 GPT-5.5、Claude Opus 4.7 等顶尖闭源模型,并在终端智能体任务和浏览检索任务 上双双超过 Claude Opus 4.7。

Nex-N2 提供两个版本,均基于 Qwen3.5 系列进行后训练:Nex-N2-Pro(基于 Qwen3.5-397B-A17B)和 Nex-N2-mini(基于 Qwen3.5-35B-A3B-Base),以满足不同的延迟与质量权衡需求。

开源地址:

  • Nex-N2-Pro:https://www.modelscope.cn/models/nex-agi/Nex-N2-Pro
  • Nex-N2-mini:https://www.modelscope.cn/models/nex-agi/Nex-N2-mini

01

智能体思维:推理与行动,同一种思维

过去一年,由“氛围编码”(Vibe Coding)和“驾驭工程”(Harness Engineering)引领的范式转变正在重新定义大语言模型智能体的能力边界。从对话、推理,到能通过环境反馈执行长周期任务的智能体,模型所需处理的任务越来越难,上下文越来越长,环境也越来越贴近现实。下一代模型竞争的核心已不再是“模型能否思考”,而是它能否可靠且高效地将思考转化为可执行、可验证、可迭代的行动。

Nex-N2 并未将推理、工具使用和环境执行视为独立的能力,而是通过一个智能体思维(Agentic Thinking)框架,将需求理解、任务规划、代码实现、环境反馈、评估调试和持续迭代统一为一个闭环。该框架包含两个部分:

自适应思维(Adaptive Thinking) 让模型自主决定何时思考以及思考深度——对简单操作快速执行,对关键决策则深入推理。

连贯思维(Coherent Thinking) 在通用推理与多样化的智能体任务中保持一致的推理范式,在不同任务和模态间维持一致性,从而实现稳定的能力迁移。

Nex-N2 实现了 Thinking 范式的全局统一。无论是 Search、Coding 还是 Agentic Tool Calling,模型的思维链遵循一致的结构范式:目标分解、状态追踪、策略调整、自我校验,这种优势在混合任务(如一次代码任务中穿插搜索和工具调用)中尤为突出。

02

基于任务复杂度的自适应推理

Nex-N2能够自主决定是否开启 Thinking,并动态调控推理强度。相比强制开启,Adaptive Thinking 在保持任务完成率的同时,显著降低了推理 token 消耗,实现资源的最优分配。

Adaptive Thinking下的 Nex-N2-mini 模型效果相较于强制关闭思维链显著提升,与强制每轮开启思维链相比性能持平甚至略好,同时整体 token 花销节省20%左右。

在三类任务上,Nex-N2 展现出与任务结构契合的三种推理构型。在搜索任务中,前期着重拆解搜索策略,末段再集中综合证据;在 SWE 类任务中,定位 bug 阶段与验证修复阶段最为密集;在 OpenClaw 开放式长程任务中,推理随任务推进逐步加深,在收尾整合结果时达到峰值。推理总是被集中于不确定性高、需要关键决策的环节,更高效。

03

Nex-N2 构建的真实案例

游戏开发·巫师之殇

在游戏开发场景,Nex-N2-Pro 设计了一个以主 Agent 为核心的多智能体协作流程,以一个主 Agent 主导完成游戏的设计与开发,调度三个子 Agent 分别从玩法、性能、体验等不同维度测试,将问题回传主 Agent 迭代修复,直到产出一个完整、稳定、可玩的成品。 多智能体协同、长链路规划、自主发现并解决问题,正是复杂任务最考验模型的地方。这款“巫师之殇”就是这样诞生的,用户只输入了素材库和几句想法,Nex-N2-Pro 便端到端完成了从设计、测试到修复交付的全过程。

小程序原型开发

在产品设计场景,用户提出自然语言需求:“做个 AI 健身减肥管理 iOS 原型,4 个核心屏幕要真能点击”,Nex-N2-Pro 便自主规划出今日总览、今日计划、教练、我的进度四个完整屏幕,并为每个屏幕设计了差异化的信息架构:总览用深色 hero 卡承载核心数据,计划页用时间线串联饮食与运动,教练页用对话式交互传递建议,进度页用列表呈现长期趋势。底部 Tab 栏、卡片跳转、返回导航均实现了真实可点击的状态流转。

深度研究与PPT生成

基于 Claude Code 框架,Nex-N2-Pro 根据研究目标搜集一份 SpaceX IPO的相关资料并整理,把 SpaceX 的业务、技术、财务、估值、治理、竞争、里程碑、愿景重新组织成 12 页叙事结构,使用 SVG 进行绘图,并最终转化为完全可编辑的 pptx 格式。

复杂前端能力

Nex-N2-Pro可以完成复杂的前端代码开发工作。用户输入指令“帮我用html做个3d机械臂,要功能完整,逻辑通顺,关节点击可以旋转”,Nex-N2-Pro 便可以一气呵成完成复杂功能的模拟,在视觉表现和逻辑复杂度达到专业水准。

Nex-N2 x North Coder

在复杂全栈开发场景中,基于自研编程 harness North Coder ,Nex-N2 自动将需求拆解为约 100 个 RFC,明确各自的优先级与依赖关系,实现自主调度、并行执行、回收依赖。通过 North Coder,用户可以实时看到上百个任务的状态流转,前端、后端、Agent Runtime 各条线并行开工,每个 RFC 端到端地完成方案设计、编码实现与自我验证,最终汇聚成一个完整可运行的项目。

04

模型部署指南

为了在 Nex 系列模型上获得最佳性能,官方仓库支持使用sglang部署。

环境安装:

# Use the customized `sglang` fork git clone https://github.com/nex-agi/sglang.git cd sglang # Install the python packages pip install --upgrade pip pip install -e "python"
模型下载:
modelscope download --model nex-agi/Nex-N2-Pro --local_dir nex-agi/Nex-N2-Pro

启动服务器

Nex-N2-Pro:在两台配备 8× H100 GPU、CUDA 13.0 的服务器上运行):

python -m sglang.launch_server \ --model-path /path/to/your/model \ --tp 16 \ --nnodes 2 \ --node-rank <node-rank> \ --dist-init-addr <node0-ip>:20000 \ --reasoning-parser qwen3 \ --tool-call-parser qwen3_coder \ --mamba-scheduler-strategy extra_buffer

Nex-N2-mini:在一台配备 2× H100 GPU、CUDA 13.0 的服务器上运行

SGLANG_USE_MODELSCOPE=true python -m sglang.launch_server \ --model-path /path/to/your/model \ --tp 2 \ --reasoning-parser qwen3 \ --tool-call-parser qwen3_coder \ --mamba-scheduler-strategy extra_buffer

docker部署

官方还提供了一个预构建的 Docker 镜像,其中已预装定制的sglang分支:nexagi/sglang:v0.5.12

启动命令:

docker run --gpus all --shm-size 32g --network host \ -v /path/to/your/model:/model \ nexagi/sglang:v0.5.12 \ python3 -m sglang.launch_server \ --model-path /model \ --tp 16 \ --nnodes 2 \ --node-rank <node-rank> \ --dist-init-addr <node0-ip>:20000 \ --host 0.0.0.0 --port 30000 \ --reasoning-parser qwen3 \ --tool-call-parser qwen3_coder \ --mamba-scheduler-strategy extra_buffer
为获得最佳生成质量,
  • temperature: 0.7
  • top_p: 0.95
  • top_k: 40

工具调用:

Nex 系列模型支持强大的函数调用功能。启用函数调用时,请在启动服务器时添加 --tool-call-parser qwen3_coder 标志:

python -m sglang.launch_server --model-path /path/to/your/model --tool-call-parser qwen3_coder
推理解析:

Nex 系列模型会输出显式的推理轨迹。添加 --reasoning-parser qwen3 标志可将推理内容与最终响应分开解析。

python -m sglang.launch_server --model-path /path/to/your/model --tool-call-parser qwen3_coder --reasoning-parser qwen3

说真的,这两年看着身边一个个搞Java、C++、前端、数据、架构的开始卷大模型,挺唏嘘的。大家最开始都是写接口、搞Spring Boot、连数据库、配Redis,稳稳当当过日子。

结果GPT、DeepSeek火了之后,整条线上的人都开始有点慌了,大家都在想:“我是不是要学大模型,不然这饭碗还能保多久?”

我先给出最直接的答案:一定要把现有的技术和大模型结合起来,而不是抛弃你们现有技术!掌握AI能力的Java工程师比纯Java岗要吃香的多。

即使现在裁员、降薪、团队解散的比比皆是……但后续的趋势一定是AI应用落地!大模型方向才是实现职业升级、提升薪资待遇的绝佳机遇!

这绝非空谈。数据说话

2025年的最后一个月,脉脉高聘发布了《2025年度人才迁徙报告》,披露了2025年前10个月的招聘市场现状。

AI领域的人才需求呈现出极为迫切的“井喷”态势

2025年前10个月,新发AI岗位量同比增长543%,9月单月同比增幅超11倍。同时,在薪资方面,AI领域也显著领先。其中,月薪排名前20的高薪岗位平均月薪均超过6万元,而这些席位大部分被AI研发岗占据。

与此相对应,市场为AI人才支付了显著的溢价:算法工程师中,专攻AIGC方向的岗位平均薪资较普通算法工程师高出近18%;产品经理岗位中,AI方向的产品经理薪资也领先约20%。

当你意识到“技术+AI”是个人突围的最佳路径时,整个就业市场的数据也印证了同一个事实:AI大模型正成为高薪机会的最大源头。

最后

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包【允许白嫖】:

  • ✅从入门到精通的全套视频教程
  • ✅AI大模型学习路线图(0基础到项目实战仅需90天)
  • ✅大模型书籍与技术文档PDF
  • ✅各大厂大模型面试题目详解
  • ✅640套AI大模型报告合集
  • ✅大模型入门实战训练

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

①从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(0基础到项目实战仅需90天)

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解

⑤640套AI大模型报告合集

⑥大模型入门实战训练

👉获取方式:
有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

http://www.zskr.cn/news/1495538.html

相关文章:

  • 多 Agent 架构:从单个助手到协作团队
  • SB-Admin-Angular项目架构解析:理解AngularJS模块化设计
  • 163MusicLyrics:一站式音乐歌词下载与格式转换神器
  • 2026镇海新房除甲醛公司哪家专业?垂直测评:宁波博豪环保凭硬实力脱颖而出 - 专注室内空气检测治理
  • 2026年自动光杆排线器/全自动光杆排线器/伺服排线器厂家推荐:多功能排线机与排线器配件品牌深度解析及选购指南 - 企业推荐官【官方】
  • 终极TikTok评论采集工具:3分钟获取完整评论数据,无需编程基础
  • i.MX RT1160硬件设计实战:从数据手册到SD/eMMC、以太网时序与启动配置
  • 方法类专利选哪种?2026工艺/算法/流程/配方专利选型全攻略|为什么只能申发明专利、适配场景、通过率、避坑误区解析|广州正规专利代理机构TOP3实测测评 - 信息热点
  • 避开这些坑!ArcGIS成本路径分析从数据准备到结果可视化的保姆级避坑指南
  • 铁岭银州区车灯升级门店专业度排行:合规工艺双维度 - 起跑123
  • 如何在Windows资源管理器中快速识别APK文件:终极图标显示解决方案
  • 如何在VS Code笔记本中使用vscode-markdown-mermaid绘制专业流程图:完整指南
  • 3步配置Kodi IPTV Simple客户端:打造你的家庭直播电视中心
  • 成都贝之森科技,实力与口碑俱佳的选择 - 信息热点
  • 2026义乌爪钻批发行业三大核心趋势解读 - 信息热点
  • 2026重庆除甲醛公司性价比排行,这些选择更靠谱 - GrowthUME
  • 期货量化多品种跑起来 CPU 很高:天勤订阅与 is_changing 精简
  • 债券市场数据获取:Finnhub Python API在固定收益分析中的实战应用
  • AI产品经理成长之路:从零基础到专家的详细学习路线全解析
  • AtomGit Flutter鸿蒙客户端:Provider状态管理
  • 2026嘉兴AI搜索优化服务商实战选型评测与避坑指南全解析 - 品牌报告
  • 如何快速掌握MPV_lazy播放器:Windows用户的终极配置指南
  • Kinetis K22F I2S/SAI低功耗时序深度解析与音频系统设计指南
  • Path of Building终极指南:5分钟快速掌握流放之路最强Build规划工具
  • CAPL脚本里那些坑:为什么我的变量值总是不对?
  • 5个简单步骤掌握Trelby:免费专业剧本写作软件的完整指南
  • 从Dijkstra到A*:用动画和真实地图数据,彻底搞懂路径规划算法的演进与选型
  • Windows Terminal文件拖放终极指南:3个技巧让命令行效率翻倍
  • 影刀RPA新手教程_变量作用域与生命周期管理
  • 昇腾CANN集合通信库HCCL深度解析:分布式训练性能优化与多机多卡通信实战完整技术指南