一、引言
1.1 研究背景
深度神经网络在各种计算机视觉任务上取得了巨大成功,但模型的计算效率始终是制约其在实际场景中部署的关键因素。特别是在目标检测领域,模型往往需要在保证精度的同时实现实时推理。
当前主流的网络架构设计往往在训练时采用复杂的多分支结构(如ResNet的残差连接、Inception的多尺度分支)来提升精度,但这些多分支结构在推理时会增加内存访问开销和计算延迟,不利于部署。
RepVGG(VGG-style Reparameterization)是清华大学于2021年提出的一种新型网络架构,其核心思想是结构重参数化(Structural Re-parameterization):训练时使用多分支结构来获得高精度,推理时通过参数重参数化将多分支结构等价转换为单路3×3卷积,从而实现极快的推理速度。
1.2 重参数化的意义
结构重参数化技术的核心优势在于:
- 训练-推理解耦:训练时使用复杂结构保证精度,推理时使用简单结构保证速度。
- 硬件友好:单路3×3卷积是现代深度学习加速器(GPU、NPU、FPGA等)优化最好的算子。
- 内存高效:多分支结构需要保存多个分支的中间结果,而单路结构可以原地计算,节省内存。
- 灵活压缩:单路结构更容易进行剪枝、量化等模型压缩操作。