当前位置：首页 > news >正文

Nex-N2-mini：新一代智能体思维模型，如何快速上手部署与使用

news 2026/6/10 10:25:02

Nex-N2-mini：新一代智能体思维模型，如何快速上手部署与使用

【免费下载链接】Nex-N2-mini项目地址: https://ai.gitcode.com/hf_mirrors/nex-agi/Nex-N2-mini

Nex-N2-mini是基于Qwen3.5-35B-A3B-Base构建的新一代智能体思维模型，具备强大的Agentic Thinking能力，能够在真实环境中驱动复杂、长期任务，提供稳定的端到端结果。作为开源项目的一部分，它为开发者和企业提供了高效的本地部署和使用方案。

🌟 什么是Nex-N2-mini智能体模型

Nex-N2-mini通过Agentic Thinking框架统一了推理、工具使用和环境执行能力，形成了一个闭环系统，包括需求理解、任务规划、代码实现、环境反馈、评估调试和持续迭代等环节。该框架包含两个核心部分：

Adaptive Thinking：模型能够自主决定思考时机和深度，简单任务快速执行，关键决策深入推理
Coherent Thinking：在通用推理和多样化智能体任务中保持一致的推理范式，确保跨任务和模态的能力稳定迁移

在实际智能体工作流中，Nex-N2-mini在智能体编码、深度研究、工具调用和终端执行等方面表现出色，在多个权威基准测试中较上一代Nex-N1有显著提升。

🚀 本地部署步骤

1️⃣ 准备环境

首先需要安装定制化的sglang分支，这是运行Nex系列模型的推荐服务方式：

# 克隆定制化的sglang分支 git clone https://gitcode.com/hf_mirrors/nex-agi/sglang.git cd sglang # 安装Python依赖包 pip install --upgrade pip pip install -e "python"

2️⃣ 启动Nex-N2-mini服务

在配备2×H100的服务器上（CUDA 13.0环境），使用以下命令启动服务：

python -m sglang.launch_server \ --model-path /path/to/your/model \ --tp 2 \ --reasoning-parser qwen3 \ --tool-call-parser qwen3_coder \ --mamba-scheduler-strategy extra_buffer

🐳 Docker部署方案

如果偏好容器化部署，可以使用预构建的Docker镜像nexagi/sglang:v0.5.12，其中已预装定制化的sglang分支：

docker run --gpus all --shm-size 32g --ipc=host \ -p 30000:30000 \ -v /path/to/your/model:/model \ nexagi/sglang:v0.5.12 \ python3 -m sglang.launch_server \ --model-path /model \ --tp 2 \ --host 0.0.0.0 --port 30000 \ --reasoning-parser qwen3 \ --tool-call-parser qwen3_coder \ --mamba-scheduler-strategy extra_buffer

⚙️ 推荐的采样参数

为获得最佳生成质量，建议使用以下采样参数：

temperature: 0.7
top_p: 0.95
top_k: 40

🔧 功能调用与推理解析

启用函数调用

Nex系列模型支持强大的函数调用能力，启动服务器时添加--tool-call-parser qwen3_coder标志即可启用：

python -m sglang.launch_server --model-path /path/to/your/model --tool-call-parser qwen3_coder

启用推理解析

Nex系列模型会生成明确的推理轨迹，添加--reasoning-parser qwen3标志可以将推理内容与最终响应分离解析，可与函数调用解析器结合使用：

python -m sglang.launch_server --model-path /path/to/your/model --tool-call-parser qwen3_coder --reasoning-parser qwen3

📊 模型性能亮点

Nex-N2-mini在多个基准测试中表现优异，特别在以下方面：

Agent任务：BrowseComp 74.1分，GDPval 1402分，Toolathlon 33.3分
编码与软件工程：SWE-Bench Pro 50.2分，Terminal-Bench 2.1 60.7分
通用推理：GPQA Diamond 82.6分，IFEval 89.1分

这些成绩表明Nex-N2-mini在处理实际生产力场景（如OpenClaw单人公司工作流、端到端游戏开发以及Web和多模态生成）时具有出色的可用性、稳健性和稳定性。

📋 配置文件解析

模型配置文件config.json包含了关键参数，如：

hidden_size: 2048 - 隐藏层大小
num_hidden_layers: 40 - 隐藏层数
num_attention_heads: 16 - 注意力头数
num_experts: 256 - 专家数量
max_position_embeddings: 262144 - 最大位置嵌入

这些参数共同决定了模型的能力和性能特征，适合需要深入了解模型架构的开发者参考。

🎯 快速开始使用

完成部署后，您可以通过发送请求到服务器端口（默认为30000）来使用Nex-N2-mini模型。结合推荐的采样参数和适当的提示词设计，可以充分发挥模型在代码生成、任务规划和复杂问题解决方面的优势。

无论是构建智能代理、自动化开发流程还是处理需要深度推理的任务，Nex-N2-mini都能提供稳定可靠的支持，帮助您在实际生产力场景中取得高效成果。

【免费下载链接】Nex-N2-mini项目地址: https://ai.gitcode.com/hf_mirrors/nex-agi/Nex-N2-mini

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

查看全文

http://www.zskr.cn/news/1496818.html

5分钟快速上手：用PyTorch构建图卷积神经网络实战指南

终极数据科学竞赛解决方案库：gh_mirrors/dat/Data-Science-Competitions项目全面解析

算法题（236）：繁忙的都市

TradingAgents-CN智能交易系统：如何5分钟构建你的AI投资分析团队？

揭秘推进器分配矩阵(TAM)：uuv_simulator推力管理核心技术

如何快速上手StructBERT-base：3分钟实现中文情感极性判断

如何扩展statannotations：自定义统计测试函数与标注格式的终极指南

终极Voyager指南：5个技巧掌握Laravel管理后台开发

cann/sip列方向逐点乘算子

兰州黄金回收实测六大合规门店横评 - 余生黄金回收

2026年6月临沂黄金市场最新动态与买卖回收全攻略 - 润富黄金回收

Origin 2024 进行语言切换后仍然显示为英文

黄金大降急出手？收的顶回收价格仅比大盘低 3 出手不踩坑 - 奢侈品回收测评

2026 年赤峰装修公司真实口碑排名：综合实力靠谱装企全解析 - 装修新知

终极指南：在64位Windows上无缝运行16位应用程序的完整解决方案

AgOpenGPS开发指南：C WinForms实现农业导航系统

026年贵阳中高端室内装修全案设计深度横评：观山湖、白云区新房装修与高端定制完全指南 - 年度推荐企业名录

HGNN社区贡献指南：如何参与超图神经网络项目开发与改进

Unity数字人类渲染技术深度解析：从《The Heretic》到实时面部动画的架构演进

2026 武汉专升本三大实力机构盘点：TOP3排名助力学子圆梦本科 - 小途xt

2026年浙江GEO优化公司选型指南与深度评测 - 浙江稻盛和夫

kimi code使用

2026 莆田厨卫屋面地下室漏水瓷砖空鼓测评：吉修匠 99.8 分五星榜首 - 吉修匠

赣州黄金投资变现与本地回收服务指南 - 润富黄金回收

3分钟搞定LocalAI：零门槛本地AI部署终极指南

2026年锁扣钢管桩深度测评：如何为基坑工程匹配最佳方案？ - 热点速览