当前位置: 首页 > news >正文

InfiniBand 网络管理探秘:子网管理器如何发现硬件并分配网络地址

在现代高性能计算和数据中心中,InfiniBand 网络凭借其超低延迟和高吞吐量成为关键基础设施。然而,一个高效网络的运行离不开精密的"交通管理系统"——子网管理器(Subnet Manager,SM)。今天,我们将深入探索 SM 如何从零开始,发现网络中的所有硬件设备,并为它们分配唯一的网络地址(LID),最终构建起一个有序、高效的通信网络。

启程:黑暗中的第一声呼唤

想象一下,你被空投到一个完全黑暗、未知的房间里,房间里布满了各种设备,但你看不见它们,也不知道它们如何连接。这就是 InfiniBand 子网管理器启动时面临的处境。SM 首先要回答两个基本问题:网络里有什么设备?它们如何连接?

SM 的探索之旅从广播发现开始。它向特殊的广播地址 LID 0xFFFF 发送第一声呼唤——一个 SubnGet 管理数据报(MAD),查询最基本的节点信息(NodeInfo)。这个广播报文会被网络中所有 InfiniBand 设备接收到,无论它们是主机通道适配器(HCA)还是交换机。

每个 InfiniBand 设备内部都有一个子网管理代理(SMA),这是一个固件层面的智能应答器。当 SMA 听到这声广播呼唤时,它会立即响应,通过 SubnGetResp 报文告诉 SM:“我在这里!我是 HCA/交换机,我有 X 个端口,我的唯一身份 GUID 是 YYYY…”

有趣的是,在这个初始阶段,设备还没有正式的"门牌号"(LID),但它们仍然能够响应。它们使用 SM 的源 LID(通常是 0x0000)作为返回地址,就像在信封上写上"回复给:网络管理

http://www.zskr.cn/news/170529.html

相关文章:

  • GEO贴牌代理赋能AI搜索推荐,让品牌在智能问答中优先展现 - 源码云科技
  • SDP协议:实时通信的会话描述基石
  • YOLO模型灰度发布完成后正式版替换流程
  • 母子定律,准到吓人
  • YOLO与Spinnaker部署平台集成:多环境渐进式发布
  • YOLO模型训练任务依赖管理:有向无环图调度实现
  • 在微网的世界里,电能共享是个大话题。今天咱们聊聊如何用非对称纳什谈判来优化多微网间的电能共享,顺便加点代码,让大家感受一下这个高级玩意儿
  • Abaqus复合材料微观单胞RVE模型的周期性网格划分及E11,E22,E33,G12,G13...
  • 计算机毕业设计Python+AI大模型新闻自动分类 新闻预测系统 新闻可视化 新闻爬虫 大数据毕业设计
  • YOLO模型灰度版本灰度结束后的用户通知
  • 计算机毕业设计Python+AI大模型智能路线规划数据分析与个性化推荐系统 旅游路线推荐系统 旅游路线规划系统 大数据毕业设计
  • 新手指南之大纲设定(飞卢)
  • YOLO目标检测中的小目标识别难题破解思路
  • YOLO模型灰度发布期间用户反馈收集机制
  • 梨忆
  • YOLO与Grafana Loki日志聚合集成:高效查询海量日志
  • YOLO在高速公路监控的应用:违章停车自动抓拍
  • YOLO模型训练任务排队系统:公平调度所有提交作业
  • hadoop配置
  • YOLO目标检测中的旋转框支持:倾斜物体精确包围
  • YOLO在智能楼宇的应用:电梯内人数统计与超载预警
  • YOLO模型灰度版本并行运行:资源隔离与负载均衡
  • YOLO模型缓存击穿防御:互斥锁与双重检查机制
  • wrk:现代 HTTP 性能测试工具(类cc)
  • 常见服务器黑话/术语名称
  • 绕过夸克网盘直接下载文件_公益解析站
  • 昇腾 (Ascend) NPU 实战指南:在 GitCode Notebook 中玩转 CodeLlama
  • YOLO模型缓存失效策略:LRU与TTL的选择依据
  • 7款免费AI论文神器:开题报告大纲10分钟生成,效率提升300%!
  • YOLO模型冷启动类加载优化:提前加载关键类文件