当前位置：首页 > news >正文

机器学习在轨道预测中的应用：两阶段模型实现精度与效率的平衡

news 2026/5/24 10:36:09

1. 项目概述与核心挑战

在低地球轨道（LEO）上，成千上万的卫星和空间碎片正以每秒数公里的速度高速飞行。精确预测它们未来的位置——轨道预测——是确保航天器安全、避免碰撞以及进行有效空间交通管理的基石。传统上，这项工作依赖于两类方法：一类是像SGP4这样的解析模型，它计算速度快，但为了效率牺牲了精度，尤其对长期预测和受大气阻力等非保守力影响显著的近地轨道物体而言，误差会快速累积；另一类是数值传播器，它通过高保真度的物理模型和复杂的数值积分来模拟所有作用力，精度极高，但计算成本巨大，模拟一颗卫星几天的轨道可能需要数分钟甚至更长时间。

随着近地空间物体数量呈指数级增长，我们面临一个严峻的矛盾：既需要SGP4那样的计算效率来处理海量目标，又需要数值传播器那样的预测精度来保障安全。机器学习，特别是结合了时间序列分析和外生变量的方法，为我们打开了一扇新的大门。它不试图从第一性原理去解算复杂的微分方程，而是像一个经验丰富的导航员，通过学习历史轨迹数据与各种环境因素（如大气密度、空间天气）之间的隐藏模式，来直接预测未来的位置。我在实际工程中尝试过，这种思路的核心优势在于，它能用极低的计算开销，获得远超简化解析模型、甚至在某些场景下逼近简化数值模型的精度，为大规模空间态势感知（SSA）提供了全新的解决方案。

2. 核心思路：当轨道预测遇见机器学习

2.1 传统方法的瓶颈与机器学习的破局点

要理解机器学习如何介入，首先得看清传统方法的“阿喀琉斯之踵”。数值传播器的核心是求解牛顿运动方程，并叠加所有已知的摄动力，包括地球非球形引力（J2, J3等项）、日月第三体引力、大气阻力、太阳光压等。这个过程本质上是数值积分，计算量随着积分步长的减小和力模型复杂度的增加而急剧上升。我曾在一个高保真度的轨道仿真项目中，为了预测一颗卫星未来3天的位置，使用了包含200阶次地球重力场模型和复杂大气模型的数值积分器，单次计算在普通工作站上就耗时超过3分钟。想象一下要对数万个空间目标进行实时或近实时的碰撞预警，这个计算量是灾难性的。

另一方面，SGP4及其同类模型采用了截然不同的思路。它们基于平均轨道根数（Two-Line Element, TLE）和一套简化的摄动分析解，计算速度极快。但问题在于，其力模型是高度简化的，尤其是对大气阻力的处理非常粗糙，这导致其预测误差，特别是在低轨，会随着时间快速发散，通常几天后位置误差就可能达到公里级。

机器学习模型的破局点在于数据驱动和函数逼近。我们不再显式地编程物理定律，而是用一个复杂的非线性函数（如神经网络）去逼近从“历史状态+环境信息”到“未来状态”的映射关系。这个函数的参数通过大量数据训练得到。其优势显而易见：

推理速度快：训练好的模型进行一次前向传播预测，通常只需毫秒甚至微秒级时间。
能隐式学习复杂关系：模型可以从数据中自动学习那些难以用简洁公式描述的复杂摄动效应及其相互作用。
可融合多源数据：可以方便地将大气模型输出、空间天气指数等外生变量作为特征输入，让模型获得更全面的环境感知。

2.2 两阶段模型架构设计：分而治之的智慧

直接用一个模型从原始数据预测未来轨道是极具挑战的。轨道动力学包含了两体运动的主旋律和各种摄动的“杂音”。本文提出的两阶段模型架构（Coarse Model + Fine-tuning FNN）体现了一种非常实用的工程思想：分而治之。

第一阶段：粗粒度预测（Coarse Model）这个阶段的目标是捕捉轨道运动中最主要、最规律的部分——即由地球中心引力主导的开普勒运动及其主要周期项。这相当于先画出一个轨道的大致轮廓。文中尝试了两种方案：

Prophet模型：这是一个基于加性模型的经典时间序列预测工具，特别擅长捕捉趋势和周期性。对于轨道数据，它可以很好地拟合出卫星在惯性空间中的周期性运动。它的优点是极其稳健，不易过拟合，但缺点是模型表达能力有限，且每次预测都需要基于一定历史窗口重新拟合，计算成本在本架构中占了大头（约98%）。
iTransformer模型：这是为多元时间序列设计的先进Transformer架构。它将每个时间步的所有特征（如x, y, z坐标）视为一个“词”，从而更好地学习变量间的依赖关系。它的预测能力更强，但作为深度模型，有过拟合的风险，需要仔细的验证策略。

实操心得：在选择粗粒度模型时，需要在“稳健性”和“表现力”之间权衡。对于轨道这种物理规律性强、噪声相对较低的数据，一个简单的线性或周期模型（如Prophet）往往能提供非常可靠的基线。而更复杂的模型（如iTransformer）虽然潜力更大，但需要更大量的数据和更精细的调参来防止其学习到数据中的噪声或特定模式，导致在未知数据上表现不佳。在工程实践中，从简单模型开始迭代通常是更稳妥的策略。

第二阶段：细粒度修正（Exogenous Variables Model）这是一个前馈神经网络（FNN）。它的输入非常关键，包括：

第一阶段粗粒度模型的预测结果。
过去一段时间的历史状态序列。
外生变量：这是提升精度的灵魂所在。主要包括：
- 大气总质量密度：使用NRLMSISE-00模型根据卫星瞬时位置、时间计算得出，是模拟大气阻力效应的核心输入。
- 重力场函数值：基于GOCO06s重力场模型计算，提供地球非球形引力的信息。
- 空间天气驱动因子：如行星际磁场强度、太阳风速度等。但文中发现，当已经有了精确的大气密度后，这些作为密度间接代理的变量贡献变得冗余，最终被剪枝。这提醒我们，特征工程不是越多越好，高度相关的特征可能引入噪声而非信息。
- 轨道根数：开普勒根数或改良春分点根数。这些参数以更简洁的形式描述了轨道几何，有时能帮助网络更好地理解轨道状态。

FNN的任务是学习一个“残差修正函数”。它利用外生变量提供的信息，去预测粗粒度预测结果与真实轨迹之间的偏差，这个偏差主要就来自于各种未在粗模型中精确考虑的摄动力。最终预测结果是粗预测加上FNN输出的修正量。

3. 数据工程：构建机器学习的“燃料库”

没有高质量的数据，再精巧的模型也是空中楼阁。轨道预测的机器学习项目，其数据工程环节至关重要且充满挑战。

3.1 核心数据源：精密星历

本文使用了国际激光测距服务（ILRS）提供的“统一预报格式”（CPF）文件作为地面真值。这是关键的一步。CPF数据来源于全球激光测距站对卫星的高精度测量，其位置精度可达厘米级，远高于常用的TLE数据。使用高精度真值数据，才能训练出高精度的模型，否则就是“垃圾进，垃圾出”。

数据融合与防泄漏技巧： CPF文件每5天生成一次，包含未来5天每隔3分钟的预报位置。为了构建一个连续、一致的时间序列，文中采用了一个重要策略：对于任意一个时间点，只采用生成时间最晚的那个CPF文件中的预报值。因为越晚生成的文件，其初始轨道确定越准，短期预报也越可靠。这确保了时间序列的“地面真值”是当时可获得的最优估计。

注意事项：在划分训练集、验证集和测试集时，必须严格按时间顺序划分。绝不能随机打乱时间序列数据。通常的做法是按时间轴切分，例如用前70%的数据训练，中间15%验证，最后15%测试。这样可以严格模拟模型在实际应用中对未来进行预测的场景，避免“时间泄漏”——即模型无意中利用未来的信息来预测过去，导致性能评估虚高。

3.2 特征工程：为模型注入物理先验

特征工程是将领域知识注入模型的主要途径。本文的特征构建思路非常清晰：尽可能复现数值传播器所知晓的信息。

状态序列：历史的位置（x, y, z）是基础输入。速度信息通过Hermite插值滤波器从位置数据中推导得出，因为速度直接关系到动能和动量，是动力学的重要部分。
关键外生变量：
- 大气密度：通过NRLMSISE-00模型计算。这是模拟低轨卫星大气阻力的最关键参数。输入包括时间、卫星位置、太阳和地磁活动指数（F10.7, Ap等）。这一步相当于把一个大气的物理模型“外包”了，让机器学习模型直接使用其结果。
- 重力扰动：通过GOCO06s重力场模型计算。这提供了地球非球形引力的量化信息，是除中心引力外最重要的保守力。
- 轨道根数：将直角坐标转换为开普勒根数（半长轴a、偏心率e、倾角i等）或改良春分点根数。这些参数有时能提供更稳定、物理意义更明确的特征表示。
特征筛选：并非所有收集来的特征都有用。文中提到，最初加入了8个空间天气指标，但后来发现它们与大气密度高度相关，且预测能力有限，因此被移除。这是一个重要的步骤：通过相关性分析、特征重要性评估（如使用模型内置的feature importance或permutation importance）等方法，剔除冗余和无关特征，可以降低模型复杂度，防止过拟合，有时甚至能提升性能。

4. 模型实现、训练与评估实战

4.1 模型构建与超参数选择

粗粒度模型配置：

Prophet：这里使用了其季节分解能力。由于轨道运动具有明确的周期性（轨道周期），Prophet可以很好地捕捉这一点。其超参数相对简单，主要需设置季节性的周期（对于近地卫星，主要周期就是其轨道周期，约90分钟）。
iTransformer：这是一个需要仔细调参的深度模型。文中给出的超参数（如表II）是经过调优的结果。例如，编码器-解码器大小、注意力头数、层数、丢弃率等都需要通过验证集性能来确定。对于轨道数据这种序列长度可能很长（数千个时间步）的任务，iTransformer将整个时间序列的每个变量作为token的思路，可能比传统Transformer按时间点token化更能捕捉全局依赖。

细粒度FNN模型：作者最终选择了一个相对简单的3层全连接网络，每层100个神经元，使用LeakyReLU激活函数，并加入了轻微的Dropout（0.01）进行正则化。这个选择很有意思，它说明了一个关键点：当粗粒度模型已经抓住了主要规律，且外生变量提供了有效的修正信息时，负责学习残差的网络并不需要非常复杂。一个足够深度的简单FNN已经具备了强大的函数逼近能力。盲目增加网络复杂度只会增加训练难度和过拟合风险。

实操心得：在构建这类“主模型+修正模型”的级联系统时，我的经验是优先把资源和注意力放在提升主模型的稳健性和修正模型的特征工程上。修正网络本身可以保持轻量化。训练时，两个模型是独立训练的。先用历史数据训练好粗粒度模型，然后用它来对训练集生成粗预测，再将“粗预测 + 历史状态 + 外生变量”作为输入，“真实位置 - 粗预测”作为目标，来训练FNN。这样可以避免误差在两级之间复杂地反向传播，简化训练过程。

4.2 评估指标与对比基准

在轨道预测领域，常用的误差指标是位置误差的统计量。本文采用了：

平均绝对误差（MAE）：对所有测试样本、三个坐标方向（x, y, z）的绝对误差取平均。它对异常值不那么敏感，能反映典型的误差水平。
均方根误差（RMSE）：先平方再开方，对大的误差惩罚更重，能反映误差的分布广度。

为了全面评估，作者设定了三个强有力的基准：

高精度数值传播器（Num. Prop.）：使用OREKIT库，整合了200x200阶次的重力场模型、日月第三体引力、NRLMSISE-00大气模型，采用Dormand-Prince 8(5,3)积分器。这代表了物理模型的“黄金标准”。
J2数值传播器：仅考虑地球扁率（J2项）摄动的简化数值模型。它比完整模型快，但精度低得多。
CPF星历文件本身：将其不同文件间的衔接误差作为理论上的“最低可达误差”，约为15米（3天内），这标定了数据本身的噪声水平。

4.3 结果深度解读与工程启示

实验结果（表IV，图2，图3）包含了许多值得深思的细节：

精度层级：不出所料，高精度数值传播器（MAE ~456米）精度最高，但耗时极长（~196秒）。两个机器学习模型（Prophet+FNN MAE ~2278米， iTransformer+FNN MAE ~3019米）精度低于前者，但显著优于仅考虑J2摄动的数值模型（MAE ~3944米）。这是一个关键结论：一个设计良好的机器学习模型，其预测精度可以超越一个中等复杂度的物理模型。
误差随时间的变化：图2显示，数值传播器的误差随时间累积较快（曲线上升斜率较陡），而两个ML模型的误差曲线则平缓得多。特别是在1天之后，ML模型的误差已经低于J2模型。这说明ML模型在抑制长期误差发散方面可能具有优势，因为它学习的是数据中的整体模式，而非积分累积局部误差。
不同坐标轴的难度：图3揭示了另一个有趣现象：对于数值传播器和iTransformer+FNN模型，z轴（通常指向北极方向）的误差最大。这可能是因为z方向的运动受某些摄动（如重力场带谐项）的影响模式更为复杂。然而，Prophet+FNN模型在z轴上的表现却相对最好。这可能是因为Prophet作为一种加性季节模型，特别擅长捕捉这种具有强周期性的信号分量。
计算效率的碾压性优势：图4（对数坐标）清晰地展示了计算效率的巨大差异。iTransformer+FNN模型进行一次3天预测仅需0.0184秒，比J2模型快约500倍，比高精度数值模型快约10000倍。即使较慢的Prophet+FNN模型（1.41秒），也比高精度数值模型快近140倍。这是机器学习方法最核心的竞争力。
精度-效率权衡：图4中的点分布形成了一条清晰的“前沿曲线”。高精度数值传播器在右上角（高精度、高耗时），J2模型在中间，两个ML模型在左下角（相对较低精度、极低耗时）。iTransformer+FNN模型是“效率冠军”，而Prophet+FNN在精度和效率之间取得了更好的平衡。在实际工程中，选择哪个模型取决于具体需求：碰撞预警的初步筛选用高效率模型快速处理海量目标，对高风险交会再用高精度模型进行复核。

5. 常见问题、挑战与未来方向

在实际部署这类系统时，会遇到一系列工程和科学上的挑战。

5.1 实操中的典型问题与排查

问题现象	可能原因	排查思路与解决方案
模型在训练集上表现很好，但在测试集上误差剧增。	过拟合。模型记住了训练数据的噪声，而非一般规律。	1.增加数据量：轨道数据周期性强，需要覆盖不同季节、不同太阳活动周期。2.强化正则化：增大Dropout比率，为FNN加入L1/L2权重正则化。3.简化模型：尝试减少网络层数或神经元数量。4.检查数据泄漏：确保测试集数据在时间上完全位于训练集之后。
预测误差在某些轨道相位（如近地点）突然增大。	模型未能充分学习该区域的复杂动力学。例如，近地点大气密度变化剧烈，阻力模型误差大。	1.特征增强：在该区域引入更精细的大气模型参数或衍生特征（如当地大气密度梯度）。2.样本加权：在训练时给这些难以预测的样本更高权重。3.模型集成：针对不同轨道阶段训练专用子模型。
引入外生变量后，模型性能没有提升甚至下降。	1. 外生变量数据质量差（噪声大、缺失多）。 2. 特征与目标的相关性弱。 3. 特征与已有特征高度共线性，干扰训练。	1.数据清洗：检查并处理外生数据中的异常值和缺失值。2.特征分析：计算特征与目标变量的相关性，进行特征重要性排序，移除无关特征。3.降维处理：对高度相关的特征组（如多种空间天气指数）使用主成分分析（PCA）进行降维。
模型对训练数据中未出现的新卫星预测效果差。	模型缺乏泛化能力，过度依赖特定物体的历史数据。	1.引入卫星本体特征：将卫星的质量、横截面积、反射系数（用于光压）等作为静态特征输入模型。2.迁移学习：在大量卫星数据上预训练一个通用模型，再用少量新卫星数据微调。3.物理信息嵌入：在模型损失函数中加入物理约束（如能量守恒、角动量守恒），引导模型学习普适规律。

5.2 未来改进方向与个人思考

基于本文的工作和我的项目经验，我认为这个领域有几个充满潜力的发展方向：

输入特征的进一步优化：
- 未来已知的外生变量：目前模型使用的是预测起始时刻已知的外生变量。一个更激进的思路是，先利用空间天气预报模型预测出未来几天的大气密度、地磁指数等，再将这个预测序列作为特征输入。这完全复现了数值预报中“先有环境预报，再有轨道预报”的流程，可能大幅提升长期预测精度。
- 更优的坐标表示：直接预测直角坐标（x,y,z）可能不是最优的。开普勒根数，特别是改良春分点根数，其变化更为缓慢和平滑（除了平近点角）。以这些根数作为预测目标，可能能简化模型的学习任务。
模型架构的演进：
- 物理信息神经网络（PINN）：在损失函数中直接加入轨道动力学方程作为约束，可以强制模型遵守基本的物理定律，即使在外推时也能保持合理的物理行为，有望提升泛化能力和长期稳定性。
- 图神经网络（GNN）：如果要同时预测一个星座或一片区域内的多个物体，物体之间的引力摄动（虽然微小）和共同的空间环境可以作为边特征，用GNN来建模物体间的相互影响。
迈向通用化模型：本文工作针对单颗卫星（LARETS）。真正的实用系统必须能处理成千上万颗特性各异的卫星和碎片。下一步的核心挑战是构建一个模型，能泛化到未见过的空间物体。这要求我们将卫星的物理属性（质量、面质比、形状、反射率）作为模型输入的一部分。模型需要学会理解“一个质量更大、截面更小的物体，在相同大气密度下受到的阻力更小”这样的物理关系。这将是实现大规模空间态势感知智能化预测的关键一跃。

从我个人的工程实践来看，机器学习在轨道预测中的应用绝不是要取代传统的物理模型，而是与之形成互补。在高精度、小规模的场景下，数值传播器仍是金标准。但在大规模、实时性要求高的场景下，如全空间目标碰撞预警筛查、巨型星座的日常运维，机器学习模型以其惊人的计算效率，提供了一个前所未有的“快速扫描”能力。将两者结合，构建一个“ML快速筛选 + 物理模型精细复核”的混合系统，可能是应对未来拥挤近地空间最务实、最有效的技术路径。这条路才刚刚开始，数据、算法与物理知识的深度融合，将催生出更强大、更智能的太空交通管理系统。

查看全文

http://www.zskr.cn/news/1366262.html