1. 项目概述为什么我们需要重新思考ROADM架构在光通信网络里混了十几年我亲眼看着流量从Gbps级别一路狂奔到Tbps甚至开始讨论Pbps。每次流量模型一更新我们这些搞网络架构的就得跟着头疼一次。核心痛点永远绕不开那个大家伙——可重构光分插复用器也就是ROADM。这东西是光网络的交通枢纽负责把不同方向来的光信号可以理解为不同颜色的光也就是不同波长灵活地交叉连接或者从网络中“下路”到本地再把本地的信号“上路”发出去。传统的ROADM为了实现所谓的“全灵活”调度——也就是无色、无方向、无竞争C/D/C——架构上往往做得非常“笨重”。为了实现无方向性一个波长可以从任意方向上路或下路这就需要用到大分光比的耦合器把信号广播到所有可能的路径再用大规模的开关阵列进行选择。带来的直接问题就是损耗巨大为了补偿损耗就得堆砌大量的掺铒光纤放大器EDFA。这不仅仅是成本问题每多一个放大器就多一个噪声源多一个故障点系统的复杂性和运维压力是指数级上升的。另一方面作为核心交换单元的光交叉连接OXC部分为了支持大量端口通常采用广播-选择或路由-选择架构依赖于大量的1xL端口波长选择开关WSS进行级联。当端口数超过单个WSS的能力比如超过20个就需要用多个WSS拼接导致设备内部光纤互连变得极其复杂像个盘丝洞可靠性、功耗和体积都成了大问题。所以当看到名古屋大学团队在2016年提出的这篇关于基于非对称多端口WSS的可重构光分插复用器架构的论文时我眼前一亮。它没有在传统架构上修修补补而是提出了一种结合子系统模块化OXC和转发器组Transponder Bank上下路的新思路并且巧妙地利用了当时刚兴起不久的MxN多端口WSS。这个方案的核心目标很明确在几乎不损失网络路由灵活性的前提下用更少的硬件、更简单的结构构建出更大规模的节点。这不仅仅是学术上的优化更是直指设备商研发和运营商部署的成本与复杂度命门。接下来我就结合自己的工程理解把这个架构的设计精髓、实现考量以及背后的性能权衡掰开揉碎了讲清楚。2. 架构核心思想与设计动机拆解2.1 传统C/D/C ROADM的瓶颈在哪里在深入新架构之前我们必须先明白它要解决什么问题。论文里提到了两种主流C/D/C OXC架构广播-选择Broadcast-and-Select和路由-选择Route-and-Select。广播-选择架构如图1(a)所示输入光信号经过一个分光器Splitter广播到所有输出方向的WSS每个WSS再根据需要选择特定波长的信号输出。它的优点是控制相对简单但缺点致命分光器损耗随端口数增加而线性增加为了将信号送达所有N个输出端口每个输入信号都要被分成N份光功率急剧下降。同时所有未被选中的波长信号都会进入WSS成为串扰噪声。因此这种架构难以扩展到大端口数。路由-选择架构如图1(b)所示它在输入侧也使用WSS称为路由级WSS先将信号路由到特定的“中间级”再经过第二个WSS选择级WSS选择最终输出。这避免了巨大的广播损耗和串扰但代价是WSS数量翻倍。更麻烦的是当需要的端口数超过单个商用WSS的最大端口数比如1x20时就必须用多个WSS“拼接”成一个更大端口的虚拟WSS。例如构建一个40x40的OXC可能需要用多个1x9或1x20的WSS进行复杂级联导致设备内部光纤连接数量激增论文中提到可达1600根制造、调试和维护都成了噩梦。上下路部分同样面临扩展性难题。为了实现C/D/C每个本地转发器Transponder都需要能连接到所有方向的输入/输出光纤。这同样需要超大分光比的耦合器和大型光开关导致上下路部分需要密集部署EDFA来补偿损耗硬件规模和功耗居高不下。2.2 新架构的两大支柱子系统模块化与转发器组论文提出的创新架构可以看作是用两个“化整为零”的策略来对抗传统架构的“庞大笨重”。支柱一子系统模块化OXCSubsystem-Modular OXC这个想法很巧妙我们不追求用一个巨无霸式的OXC覆盖所有端口而是用多个规模较小、端口数有限的OXC子系统Sub-OXC通过节点内部光纤Intra-node Fiber互连共同组成一个大规模的逻辑OXC。每个子OXC由一个MxN WSS实现。这样做的好处是什么突破端口限制单个MxN WSS的端口数M和N可能有限例如论文中假设的11x8但通过多个子系统互连可以构建出总端口数远超单个WSS能力的OXC。例如用6个这样的子系统理论上可以构建多达几十个外部端口的大节点。简化互连子系统之间的互连只在有限的内部光纤上进行远比将所有输入端口与所有输出端口进行全连接要简单得多。这大大减少了设备内部复杂的光纤布线。易于扩容网络流量增长时可以通过增加子系统模块的方式进行平滑扩容符合网络演进的实际情况。当然引入子系统互连也带来了新问题波长冲突可能发生在连接子系统的内部光纤上。因为不同子系统的流量需要通过这几条有限的内部光纤交换如果规划不当就会堵塞。这就需要配套的、感知这种限制的路由算法来解决。支柱二基于转发器组的上下路架构Transponder-Bank-Based Add/Drop对于上下路部分论文放弃了让每个转发器连接所有光纤的“全连接”梦想转而采用“分组连接”的策略。将所有本地转发器分成若干组称为“Bank”组。每个Bank只连接到一部分数量为b的节点输入/输出光纤而不是全部。这样做的好处立竿见影降低分光器损耗由于每个Bank只需要连接b条光纤其内部使用的分光器分光比可以显著降低从而减少光功率损耗。减少放大器数量损耗降低意味着所需补偿损耗的EDFA数量可以大幅减少。论文数据显示最高可减少约50%。缩小开关规模Bank内部光开关的规模从需要连接所有光纤可能几十条缩小到只需连接b条光纤降低了开关的实现难度和成本。显然这种“分组”策略牺牲了理论上的完全灵活性——一个波长不能任意选择从哪个Bank上路或下路。但论文的精髓在于它通过第三个关键部件极大地弥补了这个灵活性损失。2.3 关键赋能者非对称多端口WSSAsymmetric MxN WSS这是整个架构的“神来之笔”。一个标准的MxN WSS有M个输入端口和N个输出端口或反之。而非对称WSS在这里特指在某一侧输入侧或输出侧拥有额外端口d个的WSS。在新架构中如图3所示每个MxN WSS的端口被划分为三类节点间光纤Inter-node Fiber连接其他网络节点的外部光纤图中蓝线。节点内光纤Intra-node Fiber连接本节点内其他子系统的内部光纤图中橙线。额外光纤Additional Fiber专门用于上下路功能的端口图中红线。论文提出将这d个额外端口分配给上路Add功能如图3a架构。为什么是上路而不是下路这里一个工程上的细致考量信号在上路时其发射功率是可控且已知的。而在下路时信号经过长距离传输功率和信噪比已经有所劣化且可能各不相同。将额外端口用于上路可以更方便、更精确地对上路信号进行功率管理和均衡这对于抑制光纤非线性效应、保证全网传输性能至关重要。那么这个设计如何解决转发器组灵活性不足的问题呢关键在于这d个额外端口是集成在OXC的WSS内部的。当一个信号需要从某个Bank上路时它并不直接连接到目标输出光纤而是先连接到WSS的某个“额外端口”。然后利用这个MxN WSS本身强大的波长路由能力将这个波长从“额外端口”交叉连接到任意一条目标“节点间光纤”输出。 这样一来上路信号的“方向灵活性”实际上是由OXC核心的WSS提供的而不是由Bank内部有限的连接提供的。Bank只需要确保能连接到这d个额外端口即可。只要d设置得合理就能以较小的硬件代价恢复近乎全灵活的上下路能力。这完美地平衡了硬件复杂度与网络性能。3. 核心参数设计与路由算法解析3.1 关键参数d与b的权衡艺术架构的性能和成本很大程度上由两个参数决定每个WSS上用于上路的额外端口数d以及每个转发器组Bank所能连接的光纤数b。论文通过大量仿真为我们揭示了其中的权衡关系。额外端口数d多少才够用d决定了上路方向的灵活性上限。最理想全灵活的情况是d等于每个WSS连接的节点间光纤数论文中设为6。这意味着上路信号可以无竞争地进入任何一条外出光纤。但这样要求WSS的端口数M8d会很大增加实现难度和成本。 仿真结果图6显示了一个非常振奋人心的结论d不需要达到6只需设置为3网络所能承载的流量在10^-3阻塞率下相比全灵活d6的损失就小于1%。这是因为在实际网络中并非所有波长都需要在每一个节点上下路总有一部分是直通的。因此d3在绝大多数情况下已经足够这允许我们使用端口数更少11x8、更易实现的WSS。这个优化是硬件成本得以大幅降低的基础。每个Bank连接光纤数b性能与成本的拉锯战b决定了每个转发器组能直接访问的网络方向范围。b越小Bank的结构就越简单分光器损耗小开关规模小EDFA少成本越低但灵活性也越差因为信号可能无法直接连接到所需方向必须依赖WSS的额外端口路由这可能增加冲突概率。 仿真结果图7图8表明当b6即Bank能连接所有6条节点间光纤时性能相比全灵活节点下降约5%。当b8或10时Bank能连接的光纤数超过了实际外部光纤数意味着有冗余性能损失分别减小到3%和2%。这给了网络规划者一个清晰的权衡空间如果追求极致成本可以选择较小的b如6接受轻微的性能损失如果对性能要求苛刻可以选择较大的b如8或10用稍高的硬件成本换取更接近理想状态的性能。论文指出即使选择b10其EDFA数量相比传统架构仍能减少约50%同时开关规模也从连接数十条光纤大幅缩减到只需连接10条光纤。3.2 感知限制的路由与波长分配算法新的硬件架构引入了新的约束波长冲突可能发生在有限的节点内光纤和额外端口上。传统的、为全灵活节点设计的最短路径算法在这里可能“水土不服”导致阻塞率升高。因此论文专门设计了一套限制感知的路由与波长分配RWA算法。算法的核心思想是在选路和分配波长时主动规避可能产生冲突的“拥堵资源”优先使用“宽松资源”。其流程图如图4所示主要步骤包括路径发现找到所有能连接源宿节点的可用路径和波长。排除过长绕行丢弃那些跳数超过最短路径一定限制论文设为4跳的路径候选。这是为了避免少数连接占用过多的全网带宽。最小化节点内光纤使用在剩余路径中优先选择经过节点内光纤数量最少的路径。这一步是为了降低在内部互连光纤上发生波长冲突的概率。选择额外端口利用率最低的子系统在源节点上路节点选择当前时刻其“额外端口”利用率最低的那个子系统WSS作为起点。这有助于均衡各个WSS上路端口的负载避免个别端口过载。选择最大化路径候选的波长对于每个可用的波长计算如果使用该波长还有多少条路径可选。选择那个能保留最多未来路径选择空间的波长。这是一种前瞻性的策略有助于提高长期资源利用率。最终分配从第5步选出的最佳波长对应的路径中最终确定一条进行分配。这个算法是整套方案不可或缺的“软件灵魂”。它使得硬件上的限制有限的内部光纤和额外端口对网络整体性能的影响降到了最低确保了在硬件简化的同时网络吞吐量仍能接近理想水平。在实际设备实现中这套算法会集成在节点的控制与管理系统中。4. 硬件简化效果与工程实现考量4.1 WSS数量的大幅削减这是该架构最显著的硬件优势之一。论文以构建一个39x39端口的OXC为例进行了对比传统方案1xL WSS 路由-选择架构需要将多个小端口WSS级联。若使用1x20的WSS需要156个若使用端口更小的1x9 WSS则需要多达390个。本文方案11x8 非对称WSS 子系统模块化仅需要7个这样的WSS。WSS数量减少了93%以上这是一个数量级的差异。尽管一个11x8的MxN WSS在技术上比一个1x20的WSS更复杂、可能更贵但论文做了关键的成本分析只要一个11x8 WSS的成本低于14个1x20 WSS的成本新方案在总成本上就是有优势的。考虑到WSS是ROADM中成本最高的核心器件之一这种组件数量的锐减对降低整机成本和功耗意义重大。4.2 EDFA数量的显著降低在上下路部分由于采用了转发器组Bank结构每个Bank内部的分光器损耗大大降低。论文假设使用增益为23dB的EDFA计算了在不同拓扑网络5x5 Mesh USNET COST266中的总需求数量。 仿真结果图10清晰表明新架构所需的EDFA数量相比传统的全灵活上下路架构减少了大约50%。EDFA的减少不仅意味着成本下降更意味着节点功耗的降低和可靠性的提升更少的有源器件。4.3 工程实现中的挑战与注意事项尽管架构优势明显但在实际工程化过程中仍有几个要点需要特别注意MxN WSS的成熟度与性能在2016年论文发表时商用MxN WSS尤其是端口数不对称的可能还不成熟。如今技术已有发展但在选型时仍需关注其插入损耗、串扰、偏振相关损耗PDL、切换速度等关键指标。这些指标会直接影响节点的整体传输性能和灵活性。子系统间互连的损耗管理节点内光纤连接不同子OXC会引入额外的连接器损耗和光纤本身损耗。在光功率算设计中必须为这部分“内部跳线”损耗留出余量可能需要考虑在子系统间增加低增益的放大或使用损耗更低的互连方案。控制与管理复杂度架构从传统的“集中式”大OXC变成了“分布式”的多个子系统协同工作。这要求网管系统NMS和控制系统SDN控制器能够统一视图并高效执行前述的“限制感知RWA算法”。故障定位和性能监控的逻辑也会变得更复杂。Bank规模与转发器配置参数T每个Bank内的转发器数量在论文中设为64并指出其对路由性能影响不大主要由实际硬件限制决定。在实际部署中需要根据业务预测和端口密度来确定T。Bank划分过多T太小会降低转发器池的统计复用增益划分过少T太大则每个Bank的内部结构又会变得复杂。需要找到一个平衡点。保护与恢复该架构如何实现网络级的保护如11 1:1和故障恢复由于波长路由依赖于WSS快速重路由功能需要WSS具备快速的切换能力并且控制平面需要能快速计算新的、符合架构限制b d的备用路径。5. 总结与未来展望回顾整篇论文名古屋大学团队提出的这种基于非对称多端口WSS的ROADM架构是一次非常务实且富有洞察力的创新。它没有追求理论上完美的全灵活性而是通过子系统模块化和转发器组这两个划分结合非对称WSS的智能利用在硬件复杂度WSS数量、EDFA数量、内部连线和网络性能阻塞率、灵活性之间取得了出色的平衡。其核心价值在于它为设备供应商提供了一条构建超大规模、高密度、低功耗ROADM节点的清晰路径。通过使用相对成熟的中等端口数MxN WSS如11x8以“搭积木”的方式构建大节点避免了研发超大端口数WSS的巨大技术风险和成本。同时上下路部分的简化设计直接击中了运营商在机房空间、功耗和运维成本上的痛点。从我个人的工程经验来看这种架构思想的影响是深远的。它提示我们在光网络设计中有时“适当的约束”反而能催生出更优的整体解决方案。完全的无约束全C/D/C可能并非性价比最高的选择尤其是在面向未来海量连接和流量的场景下。随着硅光技术、液晶硅LCoS等WSS核心技术的进步MxN WSS的端口数和性能都在不断提升成本也在下降这会让论文中的架构更具可行性。同时与软件定义网络SDN的结合使得像文中提到的“限制感知算法”这类智能控制策略能够更高效地部署进一步挖掘架构的潜力。当然任何架构都有其适用范围。对于业务高度不确定、波长调度极其频繁的核心枢纽节点可能仍需更高灵活性的方案。但对于大多数城域核心网和区域骨干网节点这种以硬件效率优先、辅以智能控制补偿性能损失的架构无疑是一个极具吸引力的选择。它代表了光网络设备从“粗放堆砌”向“精细优化”演进的一个重要方向。