1. 项目概述在高速相干光通信系统的研发一线摸爬滚打了十几年我深刻体会到提升单波长频谱效率是应对流量爆炸式增长最直接、也最经济的手段。传统的方形正交幅度调制QAM星座图虽然设计简单、解调方便但其均匀分布的星座点在面对真实信道中的各种损伤尤其是激光器相位噪声时就显得有些“力不从心”了。这就好比在一条颠簸不平的路上你还坚持开着一辆底盘低、悬挂硬的跑车虽然直线快但整体通行效率和舒适度未必是最优的。星座整形技术正是为了解决这个问题而生它通过调整星座点的“位置”几何整形和“出场频率”概率整形让信号分布更贴合信道的“脾气”从而在相同的发射功率和带宽下榨取出更高的信息传输速率。最近我和团队在《Journal of Lightwave Technology》上发表了一项工作核心是解决一个长期存在的工程难题如何在一个包含非理想、不可导数字信号处理DSP模块的真实系统中进行端到端的星座优化具体来说我们聚焦于受Wiener相位噪声主导的信道这是相干光通信中的典型损伤。传统的盲相位搜索BPS算法因其出色的性能和易于并行流水线实现的优势已成为业界的相位恢复标配。然而BPS算法内部包含arg min这样的不可导操作这就像在优化路径上设置了一堵墙阻断了梯度从接收端反向传播到发射端使得基于梯度的端到端学习框架无法直接应用。我们的突破在于提出了一种可微分的盲相位搜索Differentiable BPS算法并将其无缝集成到一个端到端的比特级自编码器框架中。这个框架能够联合优化几何整形和概率整形我们称之为GeoPCS。实测结果表明相比传统的方形QAM搭配神经解映射器我们的方案在64进制系统中能稳定带来至少0.1比特/符号的性能提升即便与之前只做几何整形的工作相比也有0.05比特/符号的增益。这篇文章我将为你彻底拆解这项技术的原理、实现细节、我们在调参和工程化中踩过的坑以及它为何能成为提升下一代光通信系统性能的利器。2. 核心挑战与方案选型为何要走“可微分”这条路在深入技术细节之前我们必须先理解当前星座整形优化面临的核心矛盾。理想很丰满——我们希望设计出的星座图能完美对抗相位噪声同时保持对加性高斯白噪声AWGN的鲁棒性。但现实是信道模型和DSP算法往往非常复杂。2.1 传统优化方法的局限过去针对AWGN信道概率整形如Maxwell-Boltzmann分布和几何整形如Voronoi星座都有成熟的闭式解或高效数值方法。然而一旦信道引入了记忆效应如色散或非线性如光纤克尔效应尤其是像Wiener相位噪声这样的随机过程就很难找到解析的最优星座形状。大家开始转向机器学习特别是神经网络。早期的尝试大致分为几类代理信道模型用一个可微分的、简化的数学模型来近似真实信道。问题是模型偏差会导致优化出的星座在真实系统中“水土不服”。无梯度优化采用遗传算法、强化学习等方法。这些方法避免了可微分的要求但代价是收敛速度极慢计算成本高昂且容易陷入局部最优。分离优化先假设一个理想的相位恢复优化星座再固定星座去优化相位恢复算法。这种方法割裂了二者之间的紧密耦合无法得到全局最优解。2.2 端到端学习的优势与瓶颈端到端学习框架即比特级自编码器展现了巨大的潜力。它将发射端的映射器Mapper和接收端的解映射器Demapper都替换为神经网络中间插入信道模型。通过最小化二进制交叉熵损失函数系统可以自动学习出最适合当前信道条件的映射关系。其最大优势在于全局优化梯度从接收端损失函数出发经过信道模型一直反向传播回发射端确保了每一个可调参数星座点位置、概率分布、甚至DSP参数的更新方向都是使整体系统性能最优。然而这个框架有一个铁律从编码器到解码器之间的所有操作都必须是可微分的否则梯度流就会中断。BPS算法中的arg min操作正是这样一个“梯度杀手”。它从一组候选相位中选出一个索引这个“选择”操作本身的导数几乎处处为零或不存在无法指导神经网络参数该如何调整才能让这个选择结果变得更好。2.3 我们的核心思路软化“硬决策”既然arg min不可导我们的思路不是绕过它而是用一个可导的函数来近似它。我们引入了带温度参数的Softminsoftmin_t函数来替代arg min。让我用个类比来解释传统的arg min就像一场只有一个冠军的硬性选举只认第一名其他候选者完全被忽略。而softmin_t则像一场“软性”选举它会给所有候选者分配“票数”权重但成绩越好距离越小的候选者得到的票数越多。温度参数t控制着选举的“严厉”程度t很小时它无限接近arg min几乎把所有票都投给第一名t较大时它会更平均地分配票数。在数学上对于距离向量D [d1, d2, ..., dL]传统的BPS找到最小距离的索引ℓ_hat arg min(D)并输出对应测试相位φ[ℓ_hat]。我们的可微分BPS则计算一个权重向量w softmin_t(D), 其中w_i exp(-d_i / t) / sum(exp(-d_j / t))然后相位估计值通过加权平均得到φ_hat sum(w_i * φ_i)。这样相位估计φ_hat就成了距离D的一个可导函数而D又依赖于接收符号和神经网络参数因此梯度链得以贯通。在训练初期我们使用较大的t如1.0让梯度可以更平滑地流动帮助网络跳出局部最优随着训练进行逐渐降低t如至0.001使算法行为逼近真实的、不可导的BPS确保优化结果最终能用于实际部署。实操心得温度参数的退火策略温度t的选择是训练稳定性的关键。我们采用了一个简单的线性退火策略从t1.0开始在每个训练周期epoch后乘以一个衰减因子如0.95。直接从一个很小的t开始训练会导致梯度过早地集中在极少数测试相位上容易使优化陷入糟糕的局部最优。先“热启动”再逐步“冷却”是让网络稳步收敛的实用技巧。3. 系统模型详解从架构到实现有了可微分BPS这个关键组件我们就能构建完整的端到端优化系统了。我们的系统模型基于比特级自编码器下图清晰地展示了数据流和核心模块注此处原应有一幅系统框图描述从比特流到LLR输出的完整流程包括Tx-NN, 信道AWGNWiener Phase Noise可微分BPSRx-NN等模块。在Markdown中我们可以用文字描述其结构。整个处理链路可以概括为比特 - 独热编码 - 神经网络映射器Tx-NN- 星座符号 - 信道损伤AWGN相位噪声- 可微分BPS相位恢复 - 神经网络解映射器Rx-NN- 对数似然比LLR。3.1 发射端灵活可调的星座生成器发射端的核心是Tx-NN。对于最基本的几何整形GCSTx-NN可以简化成一个大小为2 x M的可训练权重矩阵W_m其中M2^m是星座大小如64m是每符号比特数6。这个矩阵的每一列对应一个复数星座点c_i W_m[0, i] j * W_m[1, i]。通过这种方式星座图中每一个点的横纵坐标I/Q两路都成为了神经网络的参数可以直接通过梯度下降进行优化。概率整形PCS的引入为了进一步逼近香农容量我们引入了概率整形。我们在Tx-NN之前增加了一个概率神经网络p-NN。p-NN输出一个长度为M的logits向量ℓ_p经过softmax函数后得到每个星座点出现的概率分布p。在每批训练中我们根据分布p采样生成符号序列。这里有一个工程上的关键点为了保证每个批次的符号经验分布严格符合p我们使用了精确采样算法如[26]中的方法而不是简单的多项式采样以避免引入额外的采样噪声影响梯度估计。能量归一化当引入非均匀概率后星座的平均发射功率会发生变化。我们必须进行实时能量归一化确保比较的公平性。归一化在映射之后进行M_norm { c_i * sqrt(1 / sum(p_j * |c_j|^2) ) }这意味着概率大的星座点会被更多地用于计算平均功率从而在归一化时被更大幅度地缩放最终使得整个发射符号序列的平均功率为1。3.2 信道模型Wiener相位噪声的核心地位我们的信道模型主要包含两部分加性高斯白噪声AWGNn_k ~ CN(0, σ_n^2)其中σ_n sqrt(N0) sqrt(E_s / SNR)。E_s是符号平均能量我们固定为1归一化后所以SNR直接决定了噪声功率。Wiener相位噪声这是模拟激光器相位噪声的经典模型。φ_k φ_{k-1} Δφ_k其中Δφ_k ~ N(0, σ_φ^2)σ_φ sqrt(2π Δf / R)。Δf是激光器线宽R是符号速率。这是一个随机游走过程相位误差会随时间累积。一个至关重要的训练技巧随机初始相位。在每次训练批次开始时我们设置φ_start ~ U(-π, π)。这一点与评估传统QAM时不同传统评估常从0相位开始。为什么因为我们的目标是一个无需导频的鲁棒系统。如果总是从0相位开始训练网络可能会学到依赖这个初始条件的脆弱策略。而随机的初始相位强迫神经网络和BPS算法学会处理从任何相位起点开始的相位跟踪问题这大大增强了系统的实战鲁棒性。3.3 接收端可微分BPS与神经解映射器接收信号z_k x_k * exp(j φ_k) n_k首先送入可微分BPS模块。该模块的操作流程如下生成L个测试相位ϕ [0, 2π/L, ..., 2π(L-1)/L]。对于每个接收符号z_k计算其与所有星座点c在每一个测试相位旋转下的距离d_{k,ℓ} min_{c in M} |c - z_k * exp(-j ϕ_ℓ)|^2。为了平滑噪声影响对每个测试相位ℓ计算前后共2N1个符号的距离累加和D_{k,ℓ} sum_{ik-N}^{kN} d_{i,ℓ}。关键步骤对累加距离向量D_k应用softmin_t函数得到权重向量w_k。相位估计值为测试相位的加权平均φ_hat_k ϕ^T * w_k。进行相位解缠绕unwrap操作得到连续的相位估计φ_tilde_k用于纠正接收符号x_hat_k z_k * exp(-j φ_tilde_k)。相位纠正后的符号x_hat_k被送入Rx-NN神经解映射器。Rx-NN的输出是m个比特的对数似然比LLR。我们采用一个简单的多层感知机MLP结构输入是x_hat_k的实部和虚部共2维经过几层全连接和非线性激活函数最终输出m维的LLR值。3.4 损失函数与优化目标我们优化的目标是最大化比特互信息BMI在光通信领域也常被称为广义互信息GMI。对于一批P个符号其BMI近似为BMI ≈ H(M) - (1/P) * sum_{k1}^{P} sum_{i1}^{m} log2(1 exp(-b_{k,i} * LLR_{k,i}))其中H(M)是调制符号的熵。对于均匀分布H(M) m对于概率整形H(M) -sum p(c_i) log2 p(c_i)。幸运的是在PyTorch等框架中我们可以直接使用二进制交叉熵BCE损失并设置合适的权重其梯度下降过程恰好等价于优化BMI。对于概率整形我们需要在损失函数中显式地加入熵项H(M)。4. 参数化训练让星座学会“自适应”在实际系统中信噪比SNR和激光器线宽Δf并非固定不变。我们希望训练出的星座和接收机具有一定的自适应能力。为此我们提出了参数化星座整形。4.1 实现方法我们在Tx-NN和Rx-NN的输入中除了比特信息或独热编码额外增加了两个标量输入σ_n噪声标准差和σ_φ相位噪声扩散标准差。在训练时每一批batch数据都从预设的范围[σ_n,min, σ_n,max]和[σ_φ,min, σ_φ,max]内随机采样一组信道参数。神经网络通过这两个参数感知当前的信道状态。4.2 带来的好处与观察到的现象这种方法相当于用一套网络隐式地学习了针对不同信道条件的一族星座图和接收机。它有几个显著优势计算高效比针对每个参数点单独训练一套模型成本低得多。结构一致性学习到的星座随参数变化是平滑演变的便于分析规律。部署灵活在实际系统中可以实时估计SNR和线宽并将其输入网络动态调整解映射策略。我们对参数化几何整形pGCS和参数化几何概率联合整形pGeoPCS进行了训练和可视化分析发现了一些有趣的现象pGCS的响应星座形状同时对SNR和线宽变化敏感。在高线宽/低SNR恶劣信道条件下星座点会向外围移动并在左下角等区域引入不对称性。这种不对称性有助于BPS算法解决相位模糊问题例如在传统QAM中旋转90度后星座看起来一样。同时中心区域的点会变得更密集这可以理解为“牺牲”部分中心点的抗噪能力来换取外围点更大的间距以对抗相位噪声。pGeoPCS的响应令人惊讶的是学习到的概率分布对激光器线宽变化几乎不敏感主要只随SNR变化。在低SNR下概率分布趋近于Maxwell-Boltzmann分布即能量高的星座点出现概率更低在高SNR下分布趋于均匀。而几何形状则同时随SNR和线宽变化。这表明在联合优化中系统倾向于用几何形状来对抗相位噪声用概率分布来对抗加性高斯白噪声二者有了明确的分工。避坑指南参数化训练的数据平衡在随机采样信道参数(σ_n, σ_φ)时要确保采样分布能覆盖你关心的整个操作区域。如果某些恶劣条件如极低SNR、极高线宽的样本出现频率过低网络可能无法在这些区域学到好的策略。一种实践方法是采用分层采样确保不同信噪比和线宽区间都有足够的训练样本。5. 实验结果与深度分析我们围绕64进制系统64-ary进行了大量实验核心结论是联合几何与概率整形GeoPCS始终优于纯几何整形GCS二者均显著优于传统方形QAM搭配神经解映射器的方案。5.1 固定信道参数下的性能在SNR17 dB线宽Δf100 kHz的固定条件下我们对比了多种方案方形QAM 神经解映射器作为基线。需要注意的是由于QAM的90度旋转对称性在评估时必须使用“Genie-aided”的相位滑移补偿或从零相位开始否则BPS无法工作。这在实际中意味着需要导频。几何整形GCS学习到的星座图呈现出明显的非对称性见图4a左下角点的分布与其他角落不同这直接有助于BPS进行相位模糊分辨。几何概率联合整形GeoPCS在GCS的基础上进一步优化了星座点出现概率。其性能最优比GCS高出约0.05 bit/symbol比方形QAM基线高出超过0.1 bit/symbol。神经解映射器的决策区域可视化见图5非常直观地展示了其优越性。对于每一个比特解映射器在复平面上划分的决策边界即LLR0的等高线不再是简单的直线而是复杂的曲线能够更好地贴合优化后星座点的分布从而更准确地计算每个比特的后验概率。5.2 参数化系统在不同信道下的性能我们将参数化训练的pGCS和pGeoPCS在一个变化的信道条件范围内进行评估SNR从14 dB到24 dB线宽从50 kHz到600 kHz。图11的结果清晰地显示GeoPCS的稳健增益在整个评估范围内pGeoPCS的性能曲线始终位于pGCS之上证明了联合整形的额外增益是普适的。与概率整形QAM的对比我们还训练了一个参数化的“QAM PCS”系统即固定使用方形QAM的几何位置只通过神经网络优化其Maxwell-Boltzmann分布参数λ。在低线宽区域优化了λ的QAM PCS性能与pGeoPCS相当甚至略好这得益于其完美的格雷编码和对称性。但在高线宽区域pGeoPCS和pGCS展现出更强的鲁棒性性能优势明显。这是因为几何形状的改变能更有效地帮助相位估计。高SNR下的趋势当SNR很高时22 dB加性噪声的影响变小相位噪声成为主要限制因素。此时几何整形带来的增益变得更为关键而概率整形的额外收益相对减小。5.3 可训练BPS的潜力与陷阱我们尝试将可微分BPS中的温度参数t也作为可训练参数希望系统能自动学习最佳的温度值甚至可能用更少的测试相位L达到相同性能因为softmin具有插值能力。实验结果图12喜忧参半当L60测试相位足够多时常规BPS的性能稳定优于可训练BPS。问题出在相位不连续性0和2π处。当真实相位接近这个边界时softmin_t可能会给0和2π附近的测试相位都分配较高的权重导致加权平均后的相位估计值落在π附近产生巨大误差。而常规BPS的arg min结合相位解缠绕可以很好地处理这个问题。当L30时可训练BPS有时能表现出略微更好的性能说明其插值能力在测试相位较稀疏时可能有优势。但性能波动方差很大不够稳定。结论目前可微分BPS更适合作为训练阶段的工具用于打通端到端的梯度流。在最终部署时替换回经典的、鲁棒性更强的常规BPS算法是更稳妥的选择。未来需要研究更稳定的、能处理循环边界问题的可微分相位估计器。5.4 在更真实信道模型下的验证为了检验优化出的星座在真实光纤环境中的表现我们将其置于双偏振分步傅里叶方法DP-SSFM仿真中进行验证。该模型包含了色散、非线性克尔效应等关键光纤损伤。我们使用了在简单线性模型AWGN相位噪声下训练好的pGCS和pGeoPCS模型不进行任何重新训练直接评估。结果显示图13性能趋势一致pGeoPCS仍然优于pGCS和方形QAM证明了优化策略的有效性和可迁移性。性能绝对下降由于引入了非线性损伤和残留码间干扰所有方案的绝对性能都比在简单线性模型下有所下降。这说明了信道模型在端到端优化中的重要性。未来工作需要考虑将更复杂的信道模型甚至真实硬件损伤也纳入可微分训练框架。参数输入的重要性在DP-SSFM仿真中我们需要为神经网络手动选择输入的σ_n和σ_φ参数。我们发现选择一个对应于SNR≈18 dB的σ_n能取得最好效果这暗示了神经网络对输入信道参数具有一定的泛化能力但如何自动适配更复杂的信道仍是开放问题。6. 工程实现要点与常见问题排查6.1 训练配置与超参数选择我们的实现基于PyTorch框架。以下是一些关键的训练配置经验优化器使用Adam优化器学习率初始设为1e-3并配合ReduceLROnPlateau调度器在验证集性能停滞时降低学习率。批次大小Batch Size不宜过小因为BPS算法需要前后N个符号的上下文进行平滑。我们通常使用1024或2048。BPS窗口长度2N1这是一个权衡。N越大平滑效果越好抗AWGN能力越强但对快速变化的相位噪声跟踪能力变差。需要根据激光器线宽和符号速率来调整。对于32 GBaud、线宽100 kHz的系统N在10-20之间是常见的。测试相位数量L通常设置为32或64。太少会导致量化误差大太多则增加计算量。我们的实验表明在可微分BPS训练中使用较大的L如60有助于稳定训练。6.2 常见问题与解决方案速查表问题现象可能原因排查步骤与解决方案训练损失不下降或震荡剧烈1. 学习率过高。2. 温度t初始值太小或退火过快。3. BPS梯度爆炸由于softmin_t在t很小时梯度稀疏。1. 降低学习率如降至1e-4。2. 从t1.0开始采用更缓慢的退火策略如每10个epoch衰减到0.9倍。3. 在训练初期对BPS模块的梯度进行裁剪gradient clipping。验证性能远差于训练性能1. 过拟合。2. 训练和验证时BPS算法不一致如训练用可微分验证用常规。3. 相位初始化方式不一致训练随机验证固定。1. 增加Dropout层或权重衰减L2正则化。2.确保验证时使用常规BPS算法这是评估真实性能的关键。3. 对于非对称星座验证时也应使用随机初始相位。对于QAM基线则需固定从0开始或使用导频辅助。学习到的星座点“坍塌”或聚集1. 能量归一化步骤有误导致梯度异常。2. 损失函数中未考虑功率约束网络倾向于将所有点放在原点以规避噪声。1. 检查能量归一化代码确保梯度能正确回传使用torch.sqrt()等可导操作。2. 在损失函数中加入简单的功率惩罚项如λ * (mean_power - 1)^2。概率整形中某些符号概率始终为01. 采样算法导致某些符号从未被选中其梯度始终为0。2. softmax输出的logits值差异过大导致某些概率在数值上为0。1. 使用能确保所有符号都能以非零概率被采样的算法或在损失中加入最小概率约束如拉普拉斯平滑。2. 在训练初期对p-NN的输出施加较小的权重衰减防止其过早地“放弃”某些符号。在高线宽下系统性能突然恶化BPS的滑动平均窗口N设置过小无法有效平滑相位噪声。增大BPS的窗口长度N但要注意这会增加处理延迟并可能在数据块边界引入边缘效应。在训练时可以考虑丢弃每个数据块开头和结尾的N个符号的损失以模拟稳态操作。6.3 关于部署的思考训练完成后我们得到了一个优化的星座概率对{c_i, p(c_i)}和一个神经解映射器。在实际部署中发射端可以直接使用查找表LUT实现映射概率整形部分则需要一个分布匹配器Distribution Matcher将均匀的信息比特流匹配到非均匀的符号概率上通常与前向纠错FEC编码结合如概率幅度整形PAS架构。接收端神经解映射器虽然性能好但计算复杂度可能较高。一种折中方案是用训练好的神经解映射器生成大量样本然后训练一个复杂度更低的模型如基于高斯混合模型的解映射器或一个小型MLP去近似它在性能和复杂度之间取得平衡。这项工作的价值在于它提供了一套完整的、基于梯度下降的端到端优化方法论不仅适用于相位噪声信道其“将不可导DSP模块可微分化”的核心思想可以推广到包含均衡、时钟恢复等更多复杂DSP模块的系统联合优化中。它让通信系统设计从依赖直觉和分立优化走向了基于数据的、全局联合优化的新范式。