内点法（IPM）的迭代与计算：从路径跟踪到Newton方程求解的复杂度拆解-尧图网络科技

1. 内点法复杂度分析的核心框架

理解内点法（Interior Point Method, IPM）的复杂度需要抓住两个关键指标：迭代次数和单次迭代计算量。这就像评估一辆车的性能，既要看它跑完全程需要多少圈（迭代次数），也要看每圈耗时多少（单次计算量）。实际工程中，我们常遇到这样的场景：当优化问题规模达到百万级变量时，为什么有的算法几秒就能收敛，有的却要数小时？答案就藏在这两个指标的乘积里。

先看迭代次数。现代IPM的理论基础源于路径跟踪法（Path-following Method），其精髓是让解沿着一条称为"中心路径"的轨迹逐步逼近最优解。就像黑夜中沿着路灯指引前行，每一步都确保不偏离安全区域。根据Wright等人的经典研究，要使对偶间隙（duality gap）达到ε精度，所需迭代次数上界为O(√n log(1/ε))。这里的n是变量维度——对于向量变量指元素个数，矩阵变量则指行列数。有趣的是，这个结果与问题规模呈现亚线性关系，意味着即使变量增加千倍，迭代次数仅需增加约30倍。

但具体实现中有两种策略：短步法（Short-step）和长步法（Long-step）。就像登山时选择步幅，短步法（O(log n)系数）每步稳健但步数多，长步法（O(n)系数）步幅大但需要更多调整。实际算法如SDPT3多采用短步法，因其理论保证更强。

2. Newton方程求解的计算成本拆解

每次迭代的主要计算开销集中在求解Newton方程上。这相当于每圈比赛中最耗时的弯道处理——以线性规划为例，Newton方程通常形如HΔx=-g，其中H是Hessian矩阵，g是梯度。其复杂度可分解为三个关键操作：

矩阵组装：构造Hessian矩阵需要O(mn²)次运算，其中m是约束条件数量。例如在支持向量机(SVM)中，Hessian矩阵每个元素都需要计算样本间的内积。
矩阵分解：对Hessian进行Cholesky分解需要O(n³)次运算。当n较大时，这步会成为瓶颈。
回代求解：分解后的三角矩阵求解需O(n²)次运算。

实际复杂度表达式为O(mn² + n³)，其主导项取决于m与n的相对大小：